در اخبار بی امان و پر سر و صدای اوایل سال 2023، احتمالاً در مورد ChatGPT شنیدهاید، چت ربات مجهز به GPT-3 (از لحاظ فنی 3.5) که به طرز وحشتناکی قادر به شبیه سازی پاسخهای شبیه به انسان است. به عنوان مثال، این پرسش و پاسخ ایجاد شده توسط GPT-3 را در نظر بگیرید:
آیا ChatGPT یک موتور جستجو است؟ خیر، ChatGPT یک موتور جستجو نیست. این یک چت بات هوش مصنوعی است که از پردازش زبان طبیعی برای درک و پاسخ به ورودی کاربر استفاده میکند.
این پاسخ بد نیست و به نظر میرسد چیزی باشد که یک انسان واقعی بنویسد.
تعریف GPT
GPT (Generative Pre-Transformer) یک سیستم یادگیری عمیق است که متنی را بر اساس پیشبینی الگوهای زبان پس از آموزش پیشآموز با مجموعهای از اسناد تولید میکند.
برای این پست، من از OpenAI’s Playground با مدل GPT-3 “text-davinci-003” استفاده خواهم کرد، که میتواند برای تولید پاسخهای کوتاهتر برنامهریزی شود و از ChatGPT بتا قابل اعتمادتر است. مدلهای فعلی واقعاً چشمگیر هستند، از جمله تجزیه سؤالات پیچیده.
چگونه ChatGPT را برای یک کودک 5 ساله توضیح میدهید؟
ChatGPT مانند یک دوست روباتی است که میتواند با شما صحبت کند و به سؤالات شما پاسخ دهد. مانند داشتن دوستی است که در مورد چیزهای مختلف اطلاعات زیادی دارد و میتواند به شما در یادگیری مسائل جدید کمک کند.
GPT حتی میتواند خلاقیت انسان را تقلید کند و ما را وادار نماید استعدادهای خود را زیر سؤال ببریم:
شعاری برای رستورانی با مضمون مریخ که توسط افراد مارمولک اداره میشود، به سبک ادگار آلن پو بنویسید. «مارمولکهای مریخ، اینجا با شکوه غذا بخورید، جایی که رؤیاها در آن باز میشوند و کامها به نمایش در میآیند!»
تاکنون، احتمالاً دهها نمونه را دیدهاید، بنابراین همه اینها چه ربطی به جستجوی Google و مشاغل ما بهعنوان بازاریاب جستجو دارد؟
گوگل و عصر زبان طبیعی
در روزهای اولیه جستجو، موتورهای جستجو برای فهرست کردن کلمات و عبارات کوتاه ساخته شده بودند و توانایی پردازش زبان طبیعی را نداشتند. اگر به دنبال یک لپ تاپ جدید هستید، ممکن است چیزی مانند “لپ تاپ” یا “خرید لپ تاپ” را جستجو کنید.
من گاهی به شوخی میگویم که اگر وارد Best Buy شوید و فقط شروع به فریاد زدن «لپ تاپ» کنید، احتمالاً توسط نیروهای امنیتی به بیرون بدرقه میشود. با این حال، ما انسانها با جستجوی اولیه سازگار شدیم و زبان خود را گنگ کردیم.
با پیچیدهتر شدن جستجو، یاد گرفتیم که میتوانیم از جستارهای پیچیدهتر استفاده کنیم و بهویژه با ظهور جستجوی صوتی، چیزی نزدیکتر به زبان طبیعی را آزمایش کردیم. همانطور که گوگل تطبیق پیدا کرد، اتفاق جالبی افتاد:
سؤالات ما به سؤال تبدیل شد و گوگل متوجه شد که گاهی اوقات ما پیوندی به یک منبع نمیخواهیم- ما پاسخ میخواهیم.
گوگل بهعنوان «موتور پاسخ» بسیار تکامل یافته است، از جمله ایجاد نمودار دانش و نمایش نتایج وب بهعنوان پاسخهای مستقیم به نام Featured Snippets. برای مثال، اگر «جستجوی Google چگونه کار میکند؟» را جستجو کنید، ممکن است یک اسنیپت ویژه (در اصل، یک پاسخ نسبت داده شده) مانند این را دریافت کنید:
این مثال خاص کمی بد است، اما نحوه عملکرد الگوریتم را نشان میدهد. گوگل به دنبال اسناد و مدارکی است که ممکن است به این سؤال پاسخ دهد. در این مورد، بدیهی است که متن استخراج شده واقعاً پاسخ کاملی نیست.
اکنون، همان سؤال مطرح شده در مورد GPT-3 را در نظر بگیرید:
جستجوی گوگل چگونه کار میکند؟ جستجوی گوگل با خزیدن در وب و نمایه سازی وب سایتها کار میکند. وقتی کاربر چیزی را جستجو میکند، گوگل فهرست آن را بررسی مینماید و مرتبطترین نتایج را برمی گرداند.
از ترکیبی از الگوریتمها و تکنیکهای دیگر برای تعیین ارتباط نتایج استفاده میکند. این الگوریتمها عواملی مانند کلمات استفاده شده در پرس و جو، تازگی محتوا، محبوبیت وب سایت و موقعیت مکانی کاربر را در نظر میگیرند.
من میتوانم این پاسخ را دقیق انتخاب کنم، اما در مجموع، بسیار خوب است، و پاسخی بسیار کاملتر از گزیدهای از یک وبسایت است. موتور GPT-3 اساساً چندین منبع را خلاصه کرده است.
به راحتی میتوان فهمید که این ربات چگونه میتواند باعث عصبی شدن گوگل شود. اعتماد و مشکل انتساب در ظاهر،GPT-3 و به خصوص ChatGPT میتواند پاسخهای بسیار شبیه به انسان را ارائه دهد.
با کنار گذاشتن سؤالات اخلاقی (از جمله سرقت ادبی و سوگیری، که بعداً به طور خلاصه به آنها خواهم پرداخت)، مشکلات عملی جدی وجود دارد. «پاسخ» گوگل یک مزیت عمده دارد: انتساب. به راحتی میتوانیم به صفحه منبع برویم.
گوگل نه تنها اطلاعات بیشتری را در اختیار ما قرار میدهد، بلکه زمینه بیشتری از جمله جزئیات مربوط به خود منبع را فراهم مینماید. این جزئیات میتواند به ما کمک کند به پاسخ اعتماد کنیم (یا در برخی موارد، بی اعتماد شویم).
برای مثال، پاسخ دیگری را در نظر بگیرید که GPT-3 برای سؤال بالا پاسخ داده است:
جستجوی گوگل چگونه کار میکند؟ جستجوی گوگل با استفاده از ترکیبی از الگوریتمها و برنامهها برای تجزیه و تحلیل محتوای صفحات وب و سایر محتوای آنلاین برای تعیین ارتباط آن با عبارت جستجوی کاربر کار میکند.
الگوریتمهای جستجوی Google به دنبال عوامل مختلفی هستند، از جمله چگالی کلمه کلیدی، تازگی و تعداد سایتهای دیگری که به صفحه پیوند دارند. گوگل همچنین از هوش مصنوعی و یادگیری ماشینی برای بهبود نتایج جستجوی خود استفاده میکند.
این پاسخ نیز محتمل به نظر میرسد، با این تفاوت که اکثر سئوکاران با ذکر چگالی کلمه کلیدی (خط کشی که توسط من اضافه شده است)، که به طور گسترده یک افسانه در نظر گرفته میشود، دچار شکستگی میشوند.
کاملاً ممکن است که این بخش از اطلاعات از منبع کاملاً متفاوتی آمده باشد، اما بدون ذکر منبع، نمیتوانیم آن را تأیید کنیم.
در حالی که این یک مشکل پیچیده است (متن تولید شده توسط ماشین از منابع به همان روشی که انسان استفاده میکند استفاده نمیکند، یا ممکن است از دهها یا صدها منبع استفاده کند)، رویکردهای ترکیبی که تعداد منابع را کاهش میدهد و انتساب را ارائه میدهد امکان پذیر است.
در حالی که این عملکرد در نسخه بتا است و واضح است که در مقیاس Google عمل نمیکند، Neeva تلاش میکند منابع اولیه را ارائه دهد. من عمداً یک مثال مضحک انتخاب کردهام، زیرا ریسکها کم است.
سؤالی را دقیقاً در آنچه Google قلمرو YMYL (پول شما، زندگی شما) مینامد، تصور کنید، مانند “آیا بیت کوین بهتر است یا دوج کوین؟”:
این سؤالی است که میتواند آینده مالی من را به طور جدی تحت تأثیر قرار دهد و دانستن اینکه پاسخ از کجا میآید تفاوت بزرگی ایجاد میکند و به من امکان میدهد عمیقتر بگردم و یا اعتماد کنم یا آن منابع را رد کنم.
منظور من مربوط به اعتماد یک موضوع عمیقتر و اخلاقی است که آیا متن تولید شده توسط ماشین نوعی سرقت ادبی است یا خیر. در حالی که سرقت ادبی سنتی به طور کلی نیاز به هدف و کپی کردن تکههای قابلتوجهی از متن دارد.
متن تولید شده توسط ماشین هنوز از قلم نویسندگان و سازندگان محتوا ساخته میشود، بدون اینکه – حداقل در مورد ChatGPT – هیچ گونه انتساب واضحی داشته باشد.
در مورد Google، استفاده بیش از حد از متن تولید شده توسط ماشین میتواند تولیدکنندگان محتوا را دلسرد کند و ما را به این سؤال وادار کند که آیا میخواهیم تلاشهای خود را برای دستگاه شخص دیگری انجام دهیم یا خیر.
توهمات و رؤیاهای ماشینی بدون محدودیتهای دقیق، سیستمهای یادگیری ماشینی مستعد توهم هستند. در مورد ChatGPT، این امر اساساً به این معنی است که سیستم میتواند پاسخهایی تولید کند که ریشه در واقعیت ندارند.
به زبان ساده، ChatGPT چیزی را که میگوید نمیفهمد– الگوهای جدیدی بر اساس زبان انسان ایجاد میکند. این سؤال مزخرف را که برای GPT-3 مطرح کردم در نظر بگیرید: موفقیت موتسارت در سال 1976 “سریع و خشمگین: توکیو دریفت” درباره چیست؟
موفقیت موتزارت در سال 1976 “سریع و خشمگین: توکیو رانش” به فیلمی به همین نام در سال 2006 مربوط نمیشود. این قطعهای ساز است که انرژی دیوانه کننده خیابانهای توکیو در شب را به تصویر میکشد. این آهنگ حول یک خط پیانوی جذاب و هماهنگ و یک ریتم رانندگی و شاداب ساخته شده است.
در حالی که جذاب است، چنین قطعهای وجود ندارد. من یک سؤال مزخرف پرسیدهام و GPT-3 پاسخی بیهوده به من داد. باید اشاره کنم که ChatGPT در حال حاضر دارای محدودیتهایی است که مشکلاتی از این قبیل را برطرف میکند، و مدلهای پیچیده (از جمله رابط GPT-3 OpenAI) به شما امکان میدهند «تصادفی» (تصادفی بالا = محدودیتهای کمتر) را کنترل کنید، اما مشکل اصلی چالش برانگیز است.
باز هم، یک سؤال مالی با ریسک بالاتر را در نظر بگیرید: چه چیزی محبوبتر است: Dogecoin، Bassetcoin، یا Norwegianlundehundcoin؟ دوج کوین با ارزش بازار فعلی بیش از 9 میلیارد دلار محبوبترین در بین این سه ارز دیجیتال است.
Bassetcoin و Norwegianlundehundcoin ارزهای بسیار کوچکتری هستند که ارزش بازار هر کدام تنها چند صد هزارم دلار است. ارزش بازار چند صد هزارم دلاری هر کدام برای دو ارز دیجیتال که (تا لحظه نگارش این مقاله) وجود ندارند، بسیار چشمگیر است.
با این حال، هر زمان که چندین منبع را بدون توجه به صحت یا کامل بودن آنها ترکیب کنید، این خطر واقعی وجود دارد که نتیجه نهایی مزخرف به نظر منطقی باشد.
مقیاس و اینترنت بلادرنگ این یکی کاملاً ساده است: آنچه در مقیاس بتا کار میکند ممکن است در مقیاس Google کار نکند. همانطور که مرحوم بیل اسلاوسکی اشاره کرد، فقط به این دلیل که گوگل یک ایده دارد- یا حتی یک ایده را ثبت اختراع میکند- به این معنی نیست که آنها آن ایده را در جستجو پیاده میکنند (به دلایل بسیاری).
موضوع دیگر سرعت اینترنت
ChatGPT بر روی یک پیکره ثابت آموزش داده میشود- یک لحظه در زمان. گوگل خیلی سریع اینترنت را خزیده و ایندکس میکند و میتواند اطلاعاتی را که اخیراً، بومی سازی شده و حتی شخصی سازی شدهاند را برگرداند.
شایان ذکر است که گوگل مبالغ هنگفتی را برای یادگیری ماشین سرمایه گذاری کرده است. LaMDA Google (مدل زبانی برای برنامههای گفتگو) قادر به تولید متن پیچیده و انسانمانند است. گوگل به خوبی از محدودیتها و هزینههای این مدلها آگاه است.
اگر آنها در استقرار آن در سرتاسر جستجو به آرامی حرکت کردهاند، احتمالاً دلایل خوبی دارند. در حالی که موضوع سوگیری بسیار فراتر از محدوده این مقاله است، مقیاس نیز به مسائل سوگیری کمک میکند.
هنگامی که از یک پیکره ایستا و کنترلشده عبور میکنید و مدلهای یادگیری ماشین را به کل دنیای محتوای بلادرنگ باز میکنید، تعصبات انسانی به سرعت وارد میشوند (از جمله نژادپرستی، جنسیتگرایی، همجنسگرا هراسی، و سایر سوگیریهای مخرب).
در مقیاس گوگل، کاهش سوگیری مشکلی است که نیاز به دخالت و منابع انسانی زیادی دارد. کد قرمز و تهدیدات آینده هیچ کدام از اینها به این معنی نیست که Google GPT(از جملهChatGPT) را جدی نمیگیرد.
بر اساس گزارشها، پس از ویروسی شدن ChatGPT، Google یک «کد قرمز» صادر کرد. در حالی که گوگل به طور قابل درک در مورد واکنشهای داخلی خود ساکت است، تقریباً مطمئن است که تحولات اخیر باعث تسریع بحثها و تحولات در Mountain View شده است.
تهدید واضح دیگر این است که مایکروسافت یک سرمایهگذار (به میزان ۱ میلیارد دلار) در OpenAI (و همراه با آنChatGPT) است و شایعاتی مبنی بر اینکه ممکن است میلیاردها دلار بیشتر سرمایهگذاری کنند وجود دارد.
مایکروسافت همچنین اعلام کرده است که قبل از پایان ماه مارس، ادغام ChatGPT در جستجوی Bing را آغاز میکند، اگرچه مشخص نیست که این عرضه اولیه چه مقدار طول خواهد کشید. یکی از بزرگترین تأثیرات بلند مدت مدلهایی مانند ChatGPT و LaMDA در جستجوی مکالمه (شامل، اما نه محدود به، جستجوی صوتی) خواهد بود.
“مکالمه” زیر را با ChatGPT در نظر بگیرید (ویرایش طولانی):
پنج SUV سه محوره برتر کدامند؟ دشوار است که بگوییم پنج شاسی بلند سه محوره برتر کدامند زیرا میتواند ذهنی باشد و به عواملی مانند ترجیحات شخصی، بودجه و مکان بستگی داشته باشد.
با این حال، برخی از SUV های سه محوره که اغلب جزو بهترینهای کلاس خود محسوب میشوند عبارتند از:
- هوندا پایلوت
- تویوتا هایلندر
- کیا تلوراید
- هیوندای پالیسید
- صعود سوبارو
کدام یک از آنها ارزانتر است؟
از بین پنج خودروی شاسی بلندی که نام بردم، سوبارو اسنت با قیمت اولیه حدود 32295 دلار ارزانترین قیمت را دارد. سایر شاسی بلندهایی که به آنها اشاره کردم قیمت اولیه حدود 32000 تا 38000 دلار دارند.
با این حال، مهم است که توجه داشته باشید قیمت نهایی بسته به سطحتریم خاص و گزینههایی که انتخاب میشود میتواند متفاوت باشد.
آیا سوبارو به طور کلی قابل اعتماد در نظر گرفته میشود؟
سوبارو عموماً به عنوان یک خودروساز قابل اعتماد در نظر گرفته میشود و بسیاری از خودروهای آنها از نظر قابلیت اطمینان نمره بالایی دریافت میکنند. به ویژه سوبارو اسنت به عنوان یک وسیله نقلیه قابل اعتماد با فضای داخلی راحت و مصرف سوخت خوب شهرت دارد.
طبق گزارش Consumer Reports، Ascent امتیاز قابلیت اطمینان بالاتر از حد متوسط را دریافت میکند.
با عرض پوزش، ChatGPT قطعاً میتواند چت کند (و این نسخه ویرایش شده است). به سؤالات بعدی توجه کنید و اینکه چگونه نیازی به تکرار اطلاعات یا ارائه زمینه نداشتم.
ChatGPT متوجه شد که من میخواهم از پاسخهای قبلی استفاده کنم. در حالی که این مدل همه موارد استفاده از جستجو را ارائه نمیکند، قطعاً موقعیتهایی وجود دارد که توانایی اصلاح آسان و مکالمه یک پرس و جو میتواند انقلابی باشد، به خصوص برای سؤالات پیچیده، و بله، خریدهای پیچیده.
تصور کنید گوگل بتواند در هر مرحله از این سفر به سمت خرید، تبلیغات مختلفی را ارائه دهد. متأسفانه، بزرگترین تهدید کوتاهمدت برای گوگل این است که مردم و شرکتها احتمالاً از ChatGPT برای تولید محتوای بیکیفیت استفاده میکنند که برای گوگل هزینه و زمان میبرد و احتمالاً منجر به بهروزرسانیهای الگوریتمهای اصلی و واکنشی میشود.
این یک دردسر جدی برای بازاریابان جستجو خواهد بود که باید به این بهروزرسانیها واکنش نشان دهند. چیزی که برای سال 2023 مسلم است، این است که محبوبیت ChatGPT و دسترسی به آن برای عموم مردم باعث انفجار سرمایه گذاری (به خوب یا بد) و سرعت بخشیدن به توسعه میشود.
در حالی که گوگل به جایی نمیرسد، میتوانیم انتظار داشته باشیم که چشم انداز جستجو به روشهای غیرمنتظره (و گهگاهی ناخواسته) در سال آینده تغییر کند.
این پست چقدر مفید بود؟
بر روی یک ستاره کلیک کنید تا به آن امتیاز دهید!
ارسال امتیاز
میانگین امتیاز 5 / 5. شمارش آرا: 4
تاکنون رأی ندارید! اولین نفری باشید که به این پست امتیاز می دهد.
We are sorry that this post was not useful for you!
Let us improve this post!
Tell us how we can improve this post?
Submit Feedback