یک دانشگاه تحقیقاتی در هند ۷۳ میلیون مقاله علمی را (بدون مجوز) جمعآوری کرده و آنها را برای متنکاوی و دادهپردازی ارائه میدهد.
“JNU Data Depot” نام یک پروژه مشترک است که بین، کارل مالامود (آرشیویست مستقل) آندرو لین (زیست شناس) و یک تیم تحقیقاتی از دانشگاه “جواهر لعل نهرو” دهلی نو (Jawaharlal Nehru) انجام میشود.
در این پروژه ۷۳ میلیون مقاله ژورنالی مربوط به سالهای ۱۸۴۷ تاکنون، جمعآوری شد و برای افرادی که میخواهند بهصورت غیرتجاری بر روی این متون دادهپردازی انجام دهند در دسترس قرار گرفته.
امروزه سیستمهای هوشمند دادهپردازی و متنکاوی پیشرفت زیادی داشته است و نتایج علمی قابل توجهی از این روش تولید شده، از جمله دیتابیسی از ژنها و مواد شیمیایی، نقشهای از ارتباط بین پروتئینها و بیماریها، و نظریههای علمی که بهصورت اتوماتیک ساخته شدهاند. ولی مهمترین عاملی که این فرآیند متنکاوی را با محدودیت مواجه کرده، دسترسی به متون علمی و تحقیقاتی است که عموما دسترسی به این مقالهها تحت شرایط خاص و بهصورت غیر رایگان است. این محدودیتها هم بر روی اینکه چه کسانی به متن دسترسی داشته باشند وجود دارد و هم بر سطح و نوع استفاده از هر متن.
در این پروژه و با جمعآوری ۷۳ میلیون مقاله بدون محدودیتهای دست و پا گیر، این تیم قادر است به دادهپردازی این حجم از مقالات بپردازد.
اعضای این گروه با این توجیه که آنها یک موسسه علمی هستند و صرفا نسخهای از مقالات را برای استفاده محلی (بدون دسترسی به اینترنت) تهیه کردهاند، امید دارند که در برابر دادخواستهای احتمالی در امان باشند.
این تیم همچنین به سابقه قبلی در حکم دادگاه عالی دهلی نو در سال ۲۰۱۶ هم امیدوار است، در آن زمان فروش کپی بخشی از کتابهای گران قیمتِ درسی، برای اهداف آموزشی و تحقیقی مجاز اعلام شد.
منشاء این حجم از مقاله مشخص نیست ولی “کارل مالامود” یکی از اعضای شاخص این گروه، قبلا اعلام کرده بود که به مقالات ۸ هارد درایو از سایت “sci-hub” دسترسی داشته. “sci-hub” به سایت دزدان مقالات علمی معروف است و ماموریت خود را آزادسازی مقالات و تحقیقات علمی، که با محدودیتهای ارائه عمومی مواجه هستند، اعلام میکند و آنها را در دسترس عموم قرار میدهد.
این سایت در یادبود آرون سوارتز پایهگذاری شده، کسی که به دلیل ذخیره مقالات علمی از شبکه دانشگاه MIT تحت فشار FBI قرار داشت و با تهدید محکومیت به چندین دهه زندان مواجه بود، در جریان رسیدگی به پرونده او، دادستانهای فدرال از تاکتیکهای “تاخیر قانونی در پرونده” برای تخلیه پسانداز آرون استفاده کردند. او در نهایت در سال ۲۰۱۳ تحت این فشارها به زندگی خودش پایان داد. روایت زندگی آرون سوارتز را در اپیزود ۴۷ چنل بی “آرون سوارتز؛ پسر اینترنت” تعریف کردیم.
این پروژه مورد توجه کاربران زیادی قرار گرفته، ازجمله پژوهشکده ملی گیاهشناسی، پژوهشکده ملی ژنوم،بانک اطلاعاتی مواد شیمیایی و بسیاری از مراکز تحقیقاتی، هرچند که این بانک عظیم اطلاعاتی هنوز بهصورت کامل در دسترس عموم نیست.
تحقیقاتی که تیم مالامود آنها را جمعآوری کردهاند عموما توسط ناشران، دارای حق چاپ و کپیرایت اعلام شدهاند. ولی در دفاع از این پروژه میتوان گفت این ناشران معمولا مبلغی را برای تهیه، مستندسازی، و ویرایش یا بررسی مقالاتی که منتشر میکنند، نمیپردازند. بخش عمده هزینه این تحقیقات هم بهصورت عمومی تامین شده است و دانشمندان و محققانی که این آثار را تهیه کردهاند، برای حق چاپ پولی دریافت نکردهاند.
مجلات و ناشران علمی علاوه بر این برای مرتبکردن، ویرایش و بررسی مقالاتی که منتشر میکنند هم وابسته به کار داوطلبانی هستند که آنها هم بهصورت افتخاری و رایگان این خدمات را انجام میدهند.
سهم ناشران در چرخه انتشار این آثار غالبا دریافت مقالات رایگان و انتشار آنها بهصورت غیر رایگان است، با این وجود اکثریت ناشران بزرگ علمی اعلام کردهاند، محققانی که به دنبال متنکاوی مقالات آنها هستند، به مجوز آنها نیاز دارند.
مالامود اذعان کرده که در این کار خطرات زیادی وجود دارد. ولی از نظر او انجام این کار (بهویژه در هند)، بسیار مهم است. به گفته او دانشگاهها و آزمایشگاههای هندی، هزینههای زیادی را برای دریافت اشتراک روزنامهها و مجلات علمی پرداخت میکنند و باز هم به بسیاری از مقالات مورد نیازشان دسترسی ندارند. آمار سایت SCI-hub نشان میدهد که هندیها جزو بزرگترین کاربران این سایت هستند. و این یعنی مجوزهای دانشگاهی، مقالاتِ کافی را برای محققان فراهم نمیکند. به گفته مالامود هرچند جنبشهای دسترسی آزاد به اطلاعات در اروپا و آمریکا بسیار ارزشمند هستند ولی دیگران نباید منتظر آنها بنشینند تا این مشکل را حل کنند، به گفته او ما باید خودمان هم این حرکت را پیش ببریم چون در اینجا (هند) نیاز شدیدی به اطلاعات آزاد وجود دارد.
ترجمه: مهران مرندی