خودکار تصحیح آزاردهنده: چرا قابلیت تصحیح خودکار آیفون دچار اختلال شده است؟

📅 1404/8/10 15:43 | ⏱️ 5 دقیقه مطالعه | مشاهده در منبع اصلی
خودکار تصحیح آزاردهنده: چرا قابلیت تصحیح خودکار آیفون دچار اختلال شده است؟
نگران نباشید، شما دیوانه نشده‌اید. اگر اخیراً احساس می‌کنید قابلیت تصحیح خودکار آیفون شما دچار اختلال شده است – به طور غیرقابل توضیحی کلماتی مانند "come" را به "coke" و "winter" را به "w Inter" تبدیل می‌کند – شما تنها نیستید. با توجه به نظرات آنلاین، صدها کارآگاه اینترنتی همین احساس را دارند و برخی نگرانند که این مشکل هرگز حل نشود. اپل آخرین سیستم عامل خود، iOS 26، را در سپتامبر منتشر کرد. حدود یک ماه بعد، تئوری‌های توطئه فراوان شد و ویدیویی که ظاهراً نشان می‌دهد صفحه کلید آیفون املای کلمه "thumb" را توسط کاربر به "thjmb" تغییر می‌دهد، بیش از ۹ میلیون بازدید داشته است. یان پدرسن، آماردانی که کارهای پیشگامانه‌ای در زمینه تصحیح خودکار برای مایکروسافت انجام داده است، گفت: "انواع مختلفی از تصحیح خودکار وجود دارد. دانستن اینکه افراد واقعاً از چه فناوری برای پیش‌بینی استفاده می‌کنند، کمی دشوار است، زیرا همه چیز در زیر سطح اتفاق می‌افتد." یکی از پدران معنوی تصحیح خودکار گفته است که کسانی که منتظر پاسخ هستند ممکن است هرگز نفهمند این تغییر جدید چگونه کار می‌کند – به خصوص با توجه به اینکه چه کسی پشت آن است. کنت چرچ، زبان‌شناس محاسباتی که در دهه ۱۹۹۰ به پیشگام شدن برخی از اولین رویکردها به تصحیح خودکار کمک کرد، گفت: "آنچه اپل انجام می‌دهد همیشه یک راز عمیق و تاریک است. و اپل در حفظ اسرار بهتر از اکثر شرکت‌ها عمل می‌کند." اینترنت در چند سال گذشته، حتی قبل از iOS 26، درباره تصحیح خودکار زمزمه می‌کرده است. اما حداقل یک تفاوت ملموس بین آنچه تصحیح خودکار اکنون هست و آنچه چندین سال پیش بود وجود دارد: هوش مصنوعی، یا آنچه اپل در انتشار iOS 17، "مدل زبان یادگیری ماشین روی دستگاه" نامید که از کاربران خود یاد می‌گیرد. مشکل اینجاست که این می‌تواند معانی بسیار متفاوتی داشته باشد. اپل در پاسخ به پرس و جوی گاردین گفت که تصحیح خودکار را در طول سال‌ها با آخرین فناوری‌ها به‌روز کرده است و تصحیح خودکار اکنون یک مدل زبان روی دستگاه است. آنها گفتند که مشکل صفحه کلید در ویدئو به تصحیح خودکار مربوط نمی‌شود. تصحیح خودکار یک توسعه بر روی فناوری قبلی است: غلط‌یاب. غلط‌یاب تقریباً در دهه ۱۹۷۰ آغاز شد و شامل یک فرمان اولیه در یونیکس – یک زبان کدنویسی – بود که تمام کلمات غلط املایی را در یک فایل متنی مشخص فهرست می‌کرد. این کار ساده بود: هر کلمه در یک سند با یک فرهنگ لغت مقایسه می‌شد و اگر کلمه‌ای یافت نمی‌شد، به کاربر اطلاع داده می‌شد. چرچ که از اینها برای کارهای اولیه خود در زمینه تصحیح خودکار و برنامه‌های سنتز گفتار استفاده می‌کرد، گفت: "یکی از اولین کارهایی که در آزمایشگاه‌های بل انجام دادم، کسب حق استفاده از فرهنگ لغت‌های بریتانیایی بود." تصحیح خودکار یک کلمه – یعنی پیشنهاد در لحظه واقعی که کاربر ممکن است منظور "their" را به جای "thier" داشته باشد – بسیار دشوارتر است.

این موضوع به ریاضیات مربوط می‌شود: کامپیوتر باید به صورت آماری تصمیم بگیرد که آیا منظور شما از «graff» بیشتر «giraffe» (زرافه) بوده است - که فقط دو حرف اختلاف دارد - یا یک هم‌آوا مانند «graph» (گراف). در موارد پیشرفته‌تر، غلط‌یاب خودکار همچنین باید تصمیم بگیرد که آیا کلمه واقعی انگلیسی که استفاده کرده‌اید، برای متن مناسب است یا خیر، یا اینکه احتمالاً منظور شما این بوده که پسر نوجوانتان در «math» (ریاضی) خوب است و نه «meth» (مت‌آمفتامین). تا چند سال پیش، فناوری پیشرفته «n-grams» بود، سیستمی که آنقدر خوب کار می‌کرد که بیشتر مردم آن را بدیهی می‌پنداشتند - مگر زمانی که قادر به تشخیص نام‌های کمتر رایج نبود، کلمات نامناسب را با جایگزین‌های نارضایتبخش (چیزی که می‌تواند به طرز آزاردهنده‌ای ناامیدکننده باشد) جایگزین می‌کرد، یا جملاتی مانند «delivered a baby in a cab» (نوزادی را در تاکسی زایمان کرد) را به اشتباه به «devoured a baby in a cab» (نوزادی را در تاکسی بلعید) تغییر می‌داد. به زبان ساده، n-grams نسخه بسیار پایه‌ای از مدل‌های زبان بزرگ (LLMs) مدرن مانند ChatGPT هستند. آن‌ها پیش‌بینی‌های آماری در مورد آنچه که احتمالاً خواهید گفت، بر اساس آنچه قبلاً گفته‌اید و اینکه چگونه بیشتر مردم جمله شما را کامل می‌کنند، انجام می‌دهند. چرچ می‌گوید استراتژی‌های مختلف مهندسی بر داده‌هایی که غلط‌یاب خودکار n-gram دریافت می‌کند، تأثیر می‌گذارند. اما آن‌ها دیگر پیشرفته نیستند؛ ما در عصر هوش مصنوعی هستیم. پدرسن می‌گوید پیشنهاد جدید اپل، «مدل زبان ترنسفورمر»، فناوری پیچیده‌تری نسبت به غلط‌یاب‌های خودکار قدیمی را نشان می‌دهد. ترنسفورمر یکی از پیشرفت‌های کلیدی است که مدل‌هایی مانند ChatGPT و Gemini را پشتیبانی می‌کند - این مدل‌ها را در پاسخ به پرسش‌های انسانی پیچیده‌تر می‌کند. آنچه این موضوع برای غلط‌یاب خودکار جدید به همراه دارد، کمتر مشخص است. پدرسن می‌گوید هر آنچه اپل پیاده‌سازی کرده باشد، احتمالاً بسیار کوچکتر از مدل‌های آشنای هوش مصنوعی خواهد بود - در غیر این صورت نمی‌توانست روی تلفن اجرا شود. اما نکته مهم این است که به دلیل چالش‌های تفسیر هوش مصنوعی، احتمالاً درک اینکه در غلط‌یاب خودکار جدید چه مشکلی پیش می‌آید، بسیار دشوارتر از مدل‌های قبلی خواهد بود. چرچ می‌گوید: «یک حوزه کامل وجود دارد به نام توضیح‌پذیری، تفسیرپذیری، که در آن مردم می‌خواهند بفهمند چگونه کار می‌کند. با روش‌های قدیمی‌تر، شما واقعاً می‌توانید پاسخی در مورد آنچه در حال وقوع است، دریافت کنید. جدیدترین و بهترین چیزها تا حدودی شبیه جادو هستند. آنها خیلی بهتر از موارد قدیمی کار می‌کنند. اما وقتی خراب می‌شوند، واقعاً بد هستند.»