آیا انسان ها می توانند تنها نگهبانان دانش علمی باشند؟
یک جوک قدیمی وجود دارد که فیزیکدانان دوست دارند بگویند: همه چیز قبلاً در یک مجله روسی در دهه 1960 کشف و گزارش شده است، ما فقط در مورد آن نمی دانیم. اگرچه این شوخی است، اما به دقت وضعیت فعلی امور را نشان می دهد. حجم دانش بسیار زیاد است و به سرعت در حال رشد است: انتظار میرود تعداد مقالات علمی ارسال شده در arxiv (بزرگترین و محبوبترین سرور پیشچاپ) در سال 2021 به 190000 برسد و این تنها زیرمجموعهای از ادبیات علمی تولید شده در این سال است.
واضح است که ما واقعاً نمی دانیم چه می دانیم، زیرا هیچ کس نمی تواند کل ادبیات را حتی در زمینه محدود خود بخواند (که علاوه بر مقالات مجلات، پایان نامه های دکترا، یادداشت های آزمایشگاهی، اسلایدها، مقالات سفید، یادداشت های فنی، و گزارش ها)در واقع، کاملاً ممکن است که در این حجم از مقالات، پاسخ به بسیاری از سؤالات پنهان باشد، اکتشافات مهم نادیده گرفته شده یا فراموش شده باشد، و ارتباطات پنهان بماند.
هوش مصنوعی یک راه حل بالقوه است. الگوریتمها میتوانند متن را بدون نظارت انسان تجزیه و تحلیل کنند تا روابط بین کلماتی را پیدا کنند که به کشف دانش کمک میکند. اما اگر از نگارش مقالات علمی سنتی که سبک و ساختار آن در صد سال گذشته به سختی تغییر کرده است، فاصله بگیریم، به مراتب بیشتر و بالاتر می توان دست پیدا کرد.
متن کاوی با تعدادی محدودیت ،از جمله دسترسی به متن کامل مقالات و نگرانی های قانونی همراه است. اما مهمتر از همه، هوش مصنوعی واقعا مفاهیم و روابط بین آنها را درک نمی کند و به سوگیری ها در مجموعه داده ها حساس است، مانند انتخاب مقالاتی که تجزیه و تحلیل می کند. درک مقالات علمی تا حدی برای هوش مصنوعی – و در واقع، حتی برای یک خواننده، انسانی غیرمتخصص – دشوار است زیرا استفاده از اصطلاحات تخصصی از یک رشته به رشته دیگر متفاوت است و ممکن است یک اصطلاح با معانی کاملاً متفاوت در زمینه های مختلف استفاده شود. افزایش بین رشتهای بودن تحقیقات به این معنی است که تعریف یک موضوع دقیقاً با استفاده از ترکیبی از کلمات کلیدی به منظور کشف تمام مقالات مرتبط، اغلب دشوار است. ایجاد ارتباط و (دوباره) کشف مفاهیم مشابه حتی برای باهوش ترین ذهن ها نیز سخت است.
تا زمانی که چنین باشد، نمی توان به هوش مصنوعی اعتماد کرد و انسان ها باید پس از متن کاوی، همه چیزهایی را که یک هوش مصنوعی خروجی می دهد دوباره بررسی کنند، کاری خسته کننده که هدف اصلی استفاده از هوش مصنوعی را به چالش می کشد. برای حل این مشکل، ما نیاز داریم که مقالات علمی را با بازنویسی آنها در یک نوع خاص از زبان برنامه نویسی، نه تنها به صورت ماشینی، بلکه ماشینی قابل درک کنیم. به عبارت دیگر: به ماشین ها به زبانی که می فهمند علم بیاموزید.
نوشتن دانش علمی به زبانی شبیه به برنامه نویسی خشک خواهد بود، اما پایدار خواهد بود، زیرا مفاهیم جدیدی مستقیماً به کتابخانه علمی که ماشین ها می فهمند اضافه خواهند شد. به علاوه، از آنجایی که به ماشینها حقایق علمی بیشتری آموزش داده میشود، میتوانند به دانشمندان کمک کنند تا استدلالهای منطقی خود را سادهسازی کنند. اشتباهات نقطهای، تناقضات، سرقت ادبی، و تکراریها؛ و اتصالات را برجسته کنید. هوش مصنوعی با درک قوانین فیزیکی، قدرتمندتر از هوش مصنوعی آموزشدیده بر روی دادهها است، بنابراین ماشینهای دانشآموز میتوانند به اکتشافات آینده کمک کنند. ماشینهایی که دانش زیادی از علم دارند میتوانند به جای جایگزینی دانشمندان بشری کمک کنند.
ریاضیدانان قبلاً این فرآیند ترجمه را آغاز کرده اند. آنها با نوشتن قضایا و برهان ها به زبان هایی مانند Lean، ریاضیات را به کامپیوتر آموزش می دهند. Lean یک دستیار اثبات و زبان برنامه نویسی است که در آن می توان مفاهیم ریاضی را در قالب اشیا معرفی کرد. با استفاده از اشیاء شناخته شده، Lean می تواند درست یا نادرست بودن یک جمله را استدلال کند، از این رو به ریاضیدانان کمک می کند تا شواهد را تأیید کنند و مکان هایی را شناسایی کنند که منطق آنها به اندازه کافی دقیق نیست. هرچه Lean ریاضیات بیشتری بداند، بیشتر می تواند انجام دهد. پروژه Xena در امپریال کالج لندن با هدف وارد کردن کل برنامه درسی ریاضیات در مقطع کارشناسی در Lean است. یک روز، دستیاران اثبات ممکن است به ریاضیدانان کمک کنند تا با بررسی استدلال آنها و جستجو در دانش ریاضی گسترده ای که دارند، تحقیق کنند.
ما هنوز این زبان مشترک انسان ها و ماشین ها را توسعه نداده ایم، که احتمالاً به واژگانی خاص در زمینه های مختلف تبدیل خواهد شد. اما وقتی این کار را انجام دادیم، هیچ کمبودی برای پذیرندگان اولیه وجود نخواهد داشت. همانطور که پروژه Xena نشان داده است، نسل های بومی دیجیتال می توانند زبان های جدید را خیلی سریع بدون تجربه برنامه نویسی قبلی یاد بگیرند. برای برخی از دانشمندان، این زبان ممکن است حتی ساده تر از نوشتن نثر به زبان انگلیسی باشد، که ممکن است زبان مادری آنها نباشد. این به آنها کمک میکند تا ایدهها را بهتر بسازند. مترجمان می توانند Lean را به ریاضی برگردانند، و به روشی مشابه، زبان جدید را می توان به انگلیسی یا هر زبان دیگری برای افراد غیرمتخصص تفسیر کرد.
ما هنوز این زبان مشترک انسان ها و ماشین ها را توسعه نداده ایم، که احتمالاً به واژگانی خاص در زمینه های مختلف تبدیل خواهد شد. اما وقتی این کار را انجام دادیم، هیچ کمبودی برای پذیرندگان اولیه وجود نخواهد داشت. همانطور که پروژه Xena نشان داده است، نسل های بومی دیجیتال می توانند زبان های جدید را خیلی سریع بدون تجربه برنامه نویسی قبلی یاد بگیرند. برای برخی از دانشمندان، این زبان ممکن است حتی ساده تر از نوشتن نثر به زبان انگلیسی باشد، که ممکن است زبان مادری آنها نباشد. این به آنها کمک میکند تا ایدهها را بهتر بسازند. مترجمان می توانند Lean را به ریاضی برگردانند، و به روشی مشابه، زبان جدید را می توان به انگلیسی یا هر زبان دیگری برای افراد غیرمتخصص تفسیر کرد.
این تلاش علاوه بر تلاش جمعی، زمان و هزینه زیادی را می طلبد. اما ممکن است هیچ راه دیگری برای مقابله با حجم روزافزون دانش علمی وجود نداشته باشد: ما همچنان زمان و منابع خود را برای کشف مجدد مفاهیم شناخته شده و دنبال کردن جاده های بن بست تلف می کنیم. آینده علم فقط می تواند یک شرکت انسان و ماشین باشد.
قوانین ارسال دیدگاه در سایت