آنچه درباره عملکرد واقعی ChatGPT باید بدانید

چگونه ChatGPT این‌همه اطلاعات دارد؟ پشت پرده یک مدل هوش مصنوعی زبان‌محور

در نگاه اول، توانایی ChatGPT برای پاسخ دادن به انواع پرسش‌ها، ارائه تحلیل‌های متنوع و تولید متونی با ساختاری منظم، ممکن است حیرت‌انگیز یا حتی ترسناک به نظر برسد؛ گویی این ابزار از تمام آنچه تاکنون نوشته یا گفته شده آگاه است. اما آیا تا‌به‌حال فکر کرده‌اید که چگونه چنین حجمی از اطلاعات در اختیار این مدل قرار گرفته و اصلاً چگونه کار می‌کند؟

برخلاف ظاهر قاطع و توانایی گسترده‌اش در ارائه پاسخ، ChatGPT همه‌چیزدان نیست. این مدل، انسان نیست و مانند ما فکر نمی‌کند؛ حتی اگر این‌گونه جلوه کند. گرچه در بیشتر مواقع اطلاعاتی مفید ارائه می‌دهد، اما مواردی از خطا یا توهم نیز در عملکرد آن گزارش شده‌ که روزبه‌روز بر تعدادشان افزوده می‌شود. از همین رو، آشنایی با سازوکار ابزارهایی مانند ChatGPT، شناخت محدودیت‌ها و استفاده هوشمندانه از قابلیت‌های آن، اهمیت ویژه‌ای پیدا کرده است.

ChatGPT چیست و چطور کار می‌کند؟

ChatGPT یک مدل زبان بزرگ (LLM) توسعه‌یافته توسط شرکت OpenAI است. کاربران می‌توانند به‌صورت رایگان از آن بهره ببرند یا برای دسترسی به نسخه‌های پیشرفته‌تر اشتراک خریداری کنند. این نسخه‌ها در واقع مدل‌هایی هستند که عملکردشان از نظر توانایی و میزان دانش، متفاوت است.

در قلب این ابزار، نوعی هوش مصنوعی قرار دارد که برای پیش‌بینی کلمات بعدی در یک جمله آموزش دیده است. یعنی ChatGPT اساساً تلاش می‌کند حدس بزند که در ادامه جمله یا سوال شما، چه کلمه‌ای محتمل‌تر است. به همین دلیل پاسخ‌های آن اغلب روان، منسجم و حتی گاه طنزآمیز به نظر می‌رسند. اما در اصل، این مدل نمی‌فهمد شما دقیقاً چه می‌گویید یا منظورتان چیست. گرچه ساختار زبان را می‌شناسد، اما معنا یا نیت پشت واژه‌ها را آن‌طور که انسان درک می‌کند، متوجه نمی‌شود. می‌توان آن را نسخه‌ای بسیار پیشرفته از ابزارهای «تکمیل خودکار متن» دانست که براساس اطلاعات دیده‌شده در گذشته، جمله‌ها را کامل می‌کند.

منبع دانش ChatGPT از کجاست؟

پاسخ این سؤال در داده‌های آموزشی نهفته است. ChatGPT با استفاده از حجم عظیمی از داده‌ها آموزش دیده؛ از جمله کتاب‌ها، مقالات علمی و عمومی، محتوای وب‌سایت‌ها، صفحات ویکی‌پدیا، کدهای برنامه‌نویسی، گفت‌وگوهای آنلاین و سایر منابع متنی قابل‌دسترس عمومی.

هدف از این آموزش گسترده، آموختن شیوه نگارش، توضیح، استدلال، شوخی و بیان مفاهیم توسط انسان‌ها به مدل بوده است. به همین دلیل، ChatGPT با سبک‌ها و موضوعات متنوعی از زبان آشناست. با این حال، به معنای واقعی «همه چیز» را نمی‌داند. برخی نسخه‌های این ابزار حتی به اینترنت لحظه‌ای متصل نیستند، و اطلاعاتشان ممکن است در مقاطع خاصی متوقف شده باشد. همین مسئله باعث می‌شود گاهی پاسخ‌هایی قدیمی یا ناتمام ارائه دهند. البته در برخی مدل‌های جدیدتر، قابلیت مرور وب فراهم شده و کاربران می‌توانند از طریق منوی بالا، مدل فعال را بررسی کنند.

به‌جز داده‌های اولیه، بخشی از توانایی ChatGPT از فرآیندی به نام «یادگیری تقویتی از بازخورد انسانی» (Reinforcement Learning from Human Feedback) نیز نشأت می‌گیرد؛ یعنی این مدل، از بازخورد کاربران در مورد کیفیت پاسخ‌ها نیز آموزش می‌بیند.

آیا ChatGPT کل اینترنت را خوانده است؟

پاسخ کوتاه این است: نه کاملاً. بخش‌هایی از اینترنت که به‌صورت عمومی در دسترس و غیرمحرمانه هستند، در فرایند آموزش این مدل استفاده شده‌اند؛ از جمله وبلاگ‌ها، گفت‌وگوهای عمومی، مستندات فنی و سایر محتواهای باز و غیراختصاصی. محتوایی که مشمول قوانین کپی‌رایت سخت‌گیرانه باشد یا دسترسی به آن محدود شده باشد، اصولاً نباید بخشی از این آموزش باشد.

با این حال، مرزها در این زمینه کاملاً روشن نیستند. برخی شرکت‌های فعال در حوزه هوش مصنوعی به دلیل استفاده از محتوای خاص – مانند کتاب‌های موجود در کتابخانه‌ها – مورد انتقاد قرار گرفته‌اند. اینکه آیا استفاده از چنین داده‌هایی مجاز بوده یا نه، بخشی از مباحث حقوقی و اخلاقی جاری در این زمینه است. اما با اطمینان می‌توان گفت که ChatGPT به ایمیل‌ها، اسناد خصوصی یا پایگاه‌های اطلاعاتی محرمانه کاربران دسترسی نداشته است؛ یا دست‌کم چنین انتظاری وجود دارد.

از سوی دیگر، چون این مدل با محتوای انسانی آموزش دیده، ممکن است ناخواسته بازتاب‌دهنده همان سوگیری‌ها یا کاستی‌های فرهنگی و اجتماعی باشد که در محتوای آنلاین و جامعه انسانی وجود دارد.

ChatGPT چگونه تصمیم می‌گیرد که چه بگوید؟

هنگامی که شما متنی را در ChatGPT وارد می‌کنید، این مدل آن را به واحدهای کوچک‌تری به نام «توکن» تقسیم می‌کند. سپس با استفاده از دانسته‌هایش، حدس می‌زند که توکن بعدی چه باید باشد. این فرآیند به‌صورت زنده و پیوسته انجام می‌شود تا پاسخ کامل به شما ارائه شود. به همین دلیل، گاهی پاسخ‌هایی دریافت می‌کنید که در ظاهر درست و روان‌اند اما از نظر محتوایی اشتباه هستند؛ چون ChatGPT صرفاً در حال پیش‌بینی و چیدن کلمات است، نه استدلال منطقی یا درک عمیق موضوع.

چرا ChatGPT به نظر می‌رسد همه‌چیز را می‌داند؟

احتمالاً در برخی مکالمات، این تصور به شما دست داده که ChatGPT نسبت به شما شناخت دارد. این احساس می‌تواند ناشی از قابلیت حافظه این ابزار باشد. در برخی مدل‌ها، ChatGPT می‌تواند اطلاعات کلیدی را به خاطر بسپارد و از داده‌های مکالمات قبلی شما استفاده کند. همچنین، تسلط بالای آن به نگارش و ساختار زبان، باعث می‌شود در ظاهر بسیار باهوش و مطمئن جلوه کند.

در واقع، این روان‌نویسی و انسجام ظاهری، گاهی باعث می‌شود حتی پاسخ‌های نادرست آن نیز باورپذیر باشند. اگر کاربران ندانند که این ابزار چگونه عمل می‌کند، ممکن است فریب همین ظاهر قانع‌کننده را بخورند.

جمع‌بندی: شناخت بهتر برای استفاده بهتر

هدف از این توضیحات، ایجاد هراس از هوش مصنوعی نیست. بلکه هدف آن است که کاربران با شناخت عمیق‌تر از سازوکار ابزارهایی مانند ChatGPT، بتوانند با آگاهی و دقت بیشتری از آن‌ها بهره ببرند. این ابزار می‌تواند بسیار کارآمد باشد؛ برای خلق ایده، نگارش پیش‌نویس‌ها، خلاصه‌سازی محتوا و حتی یاری در تفکر. اما دانستن اینکه این مدل چگونه آموزش دیده، چطور پاسخ تولید می‌کند و چه محدودیت‌هایی دارد، به ما کمک می‌کند تا از آن هوشمندانه‌تر استفاده کنیم – بدون آنکه فریب ظاهر فصیح و قاطع آن را بخوریم.