
چگونه ChatGPT اینهمه اطلاعات دارد؟ پشت پرده یک مدل هوش مصنوعی زبانمحور
در نگاه اول، توانایی ChatGPT برای پاسخ دادن به انواع پرسشها، ارائه تحلیلهای متنوع و تولید متونی با ساختاری منظم، ممکن است حیرتانگیز یا حتی ترسناک به نظر برسد؛ گویی این ابزار از تمام آنچه تاکنون نوشته یا گفته شده آگاه است. اما آیا تابهحال فکر کردهاید که چگونه چنین حجمی از اطلاعات در اختیار این مدل قرار گرفته و اصلاً چگونه کار میکند؟
برخلاف ظاهر قاطع و توانایی گستردهاش در ارائه پاسخ، ChatGPT همهچیزدان نیست. این مدل، انسان نیست و مانند ما فکر نمیکند؛ حتی اگر اینگونه جلوه کند. گرچه در بیشتر مواقع اطلاعاتی مفید ارائه میدهد، اما مواردی از خطا یا توهم نیز در عملکرد آن گزارش شده که روزبهروز بر تعدادشان افزوده میشود. از همین رو، آشنایی با سازوکار ابزارهایی مانند ChatGPT، شناخت محدودیتها و استفاده هوشمندانه از قابلیتهای آن، اهمیت ویژهای پیدا کرده است.
ChatGPT چیست و چطور کار میکند؟
ChatGPT یک مدل زبان بزرگ (LLM) توسعهیافته توسط شرکت OpenAI است. کاربران میتوانند بهصورت رایگان از آن بهره ببرند یا برای دسترسی به نسخههای پیشرفتهتر اشتراک خریداری کنند. این نسخهها در واقع مدلهایی هستند که عملکردشان از نظر توانایی و میزان دانش، متفاوت است.
در قلب این ابزار، نوعی هوش مصنوعی قرار دارد که برای پیشبینی کلمات بعدی در یک جمله آموزش دیده است. یعنی ChatGPT اساساً تلاش میکند حدس بزند که در ادامه جمله یا سوال شما، چه کلمهای محتملتر است. به همین دلیل پاسخهای آن اغلب روان، منسجم و حتی گاه طنزآمیز به نظر میرسند. اما در اصل، این مدل نمیفهمد شما دقیقاً چه میگویید یا منظورتان چیست. گرچه ساختار زبان را میشناسد، اما معنا یا نیت پشت واژهها را آنطور که انسان درک میکند، متوجه نمیشود. میتوان آن را نسخهای بسیار پیشرفته از ابزارهای «تکمیل خودکار متن» دانست که براساس اطلاعات دیدهشده در گذشته، جملهها را کامل میکند.

منبع دانش ChatGPT از کجاست؟
پاسخ این سؤال در دادههای آموزشی نهفته است. ChatGPT با استفاده از حجم عظیمی از دادهها آموزش دیده؛ از جمله کتابها، مقالات علمی و عمومی، محتوای وبسایتها، صفحات ویکیپدیا، کدهای برنامهنویسی، گفتوگوهای آنلاین و سایر منابع متنی قابلدسترس عمومی.
هدف از این آموزش گسترده، آموختن شیوه نگارش، توضیح، استدلال، شوخی و بیان مفاهیم توسط انسانها به مدل بوده است. به همین دلیل، ChatGPT با سبکها و موضوعات متنوعی از زبان آشناست. با این حال، به معنای واقعی «همه چیز» را نمیداند. برخی نسخههای این ابزار حتی به اینترنت لحظهای متصل نیستند، و اطلاعاتشان ممکن است در مقاطع خاصی متوقف شده باشد. همین مسئله باعث میشود گاهی پاسخهایی قدیمی یا ناتمام ارائه دهند. البته در برخی مدلهای جدیدتر، قابلیت مرور وب فراهم شده و کاربران میتوانند از طریق منوی بالا، مدل فعال را بررسی کنند.
بهجز دادههای اولیه، بخشی از توانایی ChatGPT از فرآیندی به نام «یادگیری تقویتی از بازخورد انسانی» (Reinforcement Learning from Human Feedback) نیز نشأت میگیرد؛ یعنی این مدل، از بازخورد کاربران در مورد کیفیت پاسخها نیز آموزش میبیند.
آیا ChatGPT کل اینترنت را خوانده است؟
پاسخ کوتاه این است: نه کاملاً. بخشهایی از اینترنت که بهصورت عمومی در دسترس و غیرمحرمانه هستند، در فرایند آموزش این مدل استفاده شدهاند؛ از جمله وبلاگها، گفتوگوهای عمومی، مستندات فنی و سایر محتواهای باز و غیراختصاصی. محتوایی که مشمول قوانین کپیرایت سختگیرانه باشد یا دسترسی به آن محدود شده باشد، اصولاً نباید بخشی از این آموزش باشد.
با این حال، مرزها در این زمینه کاملاً روشن نیستند. برخی شرکتهای فعال در حوزه هوش مصنوعی به دلیل استفاده از محتوای خاص – مانند کتابهای موجود در کتابخانهها – مورد انتقاد قرار گرفتهاند. اینکه آیا استفاده از چنین دادههایی مجاز بوده یا نه، بخشی از مباحث حقوقی و اخلاقی جاری در این زمینه است. اما با اطمینان میتوان گفت که ChatGPT به ایمیلها، اسناد خصوصی یا پایگاههای اطلاعاتی محرمانه کاربران دسترسی نداشته است؛ یا دستکم چنین انتظاری وجود دارد.
از سوی دیگر، چون این مدل با محتوای انسانی آموزش دیده، ممکن است ناخواسته بازتابدهنده همان سوگیریها یا کاستیهای فرهنگی و اجتماعی باشد که در محتوای آنلاین و جامعه انسانی وجود دارد.
ChatGPT چگونه تصمیم میگیرد که چه بگوید؟
هنگامی که شما متنی را در ChatGPT وارد میکنید، این مدل آن را به واحدهای کوچکتری به نام «توکن» تقسیم میکند. سپس با استفاده از دانستههایش، حدس میزند که توکن بعدی چه باید باشد. این فرآیند بهصورت زنده و پیوسته انجام میشود تا پاسخ کامل به شما ارائه شود. به همین دلیل، گاهی پاسخهایی دریافت میکنید که در ظاهر درست و رواناند اما از نظر محتوایی اشتباه هستند؛ چون ChatGPT صرفاً در حال پیشبینی و چیدن کلمات است، نه استدلال منطقی یا درک عمیق موضوع.
چرا ChatGPT به نظر میرسد همهچیز را میداند؟
احتمالاً در برخی مکالمات، این تصور به شما دست داده که ChatGPT نسبت به شما شناخت دارد. این احساس میتواند ناشی از قابلیت حافظه این ابزار باشد. در برخی مدلها، ChatGPT میتواند اطلاعات کلیدی را به خاطر بسپارد و از دادههای مکالمات قبلی شما استفاده کند. همچنین، تسلط بالای آن به نگارش و ساختار زبان، باعث میشود در ظاهر بسیار باهوش و مطمئن جلوه کند.
در واقع، این رواننویسی و انسجام ظاهری، گاهی باعث میشود حتی پاسخهای نادرست آن نیز باورپذیر باشند. اگر کاربران ندانند که این ابزار چگونه عمل میکند، ممکن است فریب همین ظاهر قانعکننده را بخورند.
جمعبندی: شناخت بهتر برای استفاده بهتر
هدف از این توضیحات، ایجاد هراس از هوش مصنوعی نیست. بلکه هدف آن است که کاربران با شناخت عمیقتر از سازوکار ابزارهایی مانند ChatGPT، بتوانند با آگاهی و دقت بیشتری از آنها بهره ببرند. این ابزار میتواند بسیار کارآمد باشد؛ برای خلق ایده، نگارش پیشنویسها، خلاصهسازی محتوا و حتی یاری در تفکر. اما دانستن اینکه این مدل چگونه آموزش دیده، چطور پاسخ تولید میکند و چه محدودیتهایی دارد، به ما کمک میکند تا از آن هوشمندانهتر استفاده کنیم – بدون آنکه فریب ظاهر فصیح و قاطع آن را بخوریم.