خودکار تصحیح آزاردهنده: چرا قابلیت تصحیح خودکار آیفون دچار اختلال شده است؟
نگران نباشید، شما دیوانه نشدهاید. اگر اخیراً احساس میکنید قابلیت تصحیح خودکار آیفون شما دچار اختلال شده است – به طور غیرقابل توضیحی کلماتی مانند "come" را به "coke" و "winter" را به "w Inter" تبدیل میکند – شما تنها نیستید. با توجه به نظرات آنلاین، صدها کارآگاه اینترنتی همین احساس را دارند و برخی نگرانند که این مشکل هرگز حل نشود. اپل آخرین سیستم عامل خود، iOS 26، را در سپتامبر منتشر کرد. حدود یک ماه بعد، تئوریهای توطئه فراوان شد و ویدیویی که ظاهراً نشان میدهد صفحه کلید آیفون املای کلمه "thumb" را توسط کاربر به "thjmb" تغییر میدهد، بیش از ۹ میلیون بازدید داشته است. یان پدرسن، آماردانی که کارهای پیشگامانهای در زمینه تصحیح خودکار برای مایکروسافت انجام داده است، گفت: "انواع مختلفی از تصحیح خودکار وجود دارد. دانستن اینکه افراد واقعاً از چه فناوری برای پیشبینی استفاده میکنند، کمی دشوار است، زیرا همه چیز در زیر سطح اتفاق میافتد." یکی از پدران معنوی تصحیح خودکار گفته است که کسانی که منتظر پاسخ هستند ممکن است هرگز نفهمند این تغییر جدید چگونه کار میکند – به خصوص با توجه به اینکه چه کسی پشت آن است. کنت چرچ، زبانشناس محاسباتی که در دهه ۱۹۹۰ به پیشگام شدن برخی از اولین رویکردها به تصحیح خودکار کمک کرد، گفت: "آنچه اپل انجام میدهد همیشه یک راز عمیق و تاریک است. و اپل در حفظ اسرار بهتر از اکثر شرکتها عمل میکند." اینترنت در چند سال گذشته، حتی قبل از iOS 26، درباره تصحیح خودکار زمزمه میکرده است. اما حداقل یک تفاوت ملموس بین آنچه تصحیح خودکار اکنون هست و آنچه چندین سال پیش بود وجود دارد: هوش مصنوعی، یا آنچه اپل در انتشار iOS 17، "مدل زبان یادگیری ماشین روی دستگاه" نامید که از کاربران خود یاد میگیرد. مشکل اینجاست که این میتواند معانی بسیار متفاوتی داشته باشد. اپل در پاسخ به پرس و جوی گاردین گفت که تصحیح خودکار را در طول سالها با آخرین فناوریها بهروز کرده است و تصحیح خودکار اکنون یک مدل زبان روی دستگاه است. آنها گفتند که مشکل صفحه کلید در ویدئو به تصحیح خودکار مربوط نمیشود. تصحیح خودکار یک توسعه بر روی فناوری قبلی است: غلطیاب. غلطیاب تقریباً در دهه ۱۹۷۰ آغاز شد و شامل یک فرمان اولیه در یونیکس – یک زبان کدنویسی – بود که تمام کلمات غلط املایی را در یک فایل متنی مشخص فهرست میکرد. این کار ساده بود: هر کلمه در یک سند با یک فرهنگ لغت مقایسه میشد و اگر کلمهای یافت نمیشد، به کاربر اطلاع داده میشد. چرچ که از اینها برای کارهای اولیه خود در زمینه تصحیح خودکار و برنامههای سنتز گفتار استفاده میکرد، گفت: "یکی از اولین کارهایی که در آزمایشگاههای بل انجام دادم، کسب حق استفاده از فرهنگ لغتهای بریتانیایی بود." تصحیح خودکار یک کلمه – یعنی پیشنهاد در لحظه واقعی که کاربر ممکن است منظور "their" را به جای "thier" داشته باشد – بسیار دشوارتر است.
این موضوع به ریاضیات مربوط میشود: کامپیوتر باید به صورت آماری تصمیم بگیرد که آیا منظور شما از «graff» بیشتر «giraffe» (زرافه) بوده است - که فقط دو حرف اختلاف دارد - یا یک همآوا مانند «graph» (گراف). در موارد پیشرفتهتر، غلطیاب خودکار همچنین باید تصمیم بگیرد که آیا کلمه واقعی انگلیسی که استفاده کردهاید، برای متن مناسب است یا خیر، یا اینکه احتمالاً منظور شما این بوده که پسر نوجوانتان در «math» (ریاضی) خوب است و نه «meth» (متآمفتامین). تا چند سال پیش، فناوری پیشرفته «n-grams» بود، سیستمی که آنقدر خوب کار میکرد که بیشتر مردم آن را بدیهی میپنداشتند - مگر زمانی که قادر به تشخیص نامهای کمتر رایج نبود، کلمات نامناسب را با جایگزینهای نارضایتبخش (چیزی که میتواند به طرز آزاردهندهای ناامیدکننده باشد) جایگزین میکرد، یا جملاتی مانند «delivered a baby in a cab» (نوزادی را در تاکسی زایمان کرد) را به اشتباه به «devoured a baby in a cab» (نوزادی را در تاکسی بلعید) تغییر میداد. به زبان ساده، n-grams نسخه بسیار پایهای از مدلهای زبان بزرگ (LLMs) مدرن مانند ChatGPT هستند. آنها پیشبینیهای آماری در مورد آنچه که احتمالاً خواهید گفت، بر اساس آنچه قبلاً گفتهاید و اینکه چگونه بیشتر مردم جمله شما را کامل میکنند، انجام میدهند. چرچ میگوید استراتژیهای مختلف مهندسی بر دادههایی که غلطیاب خودکار n-gram دریافت میکند، تأثیر میگذارند. اما آنها دیگر پیشرفته نیستند؛ ما در عصر هوش مصنوعی هستیم. پدرسن میگوید پیشنهاد جدید اپل، «مدل زبان ترنسفورمر»، فناوری پیچیدهتری نسبت به غلطیابهای خودکار قدیمی را نشان میدهد. ترنسفورمر یکی از پیشرفتهای کلیدی است که مدلهایی مانند ChatGPT و Gemini را پشتیبانی میکند - این مدلها را در پاسخ به پرسشهای انسانی پیچیدهتر میکند. آنچه این موضوع برای غلطیاب خودکار جدید به همراه دارد، کمتر مشخص است. پدرسن میگوید هر آنچه اپل پیادهسازی کرده باشد، احتمالاً بسیار کوچکتر از مدلهای آشنای هوش مصنوعی خواهد بود - در غیر این صورت نمیتوانست روی تلفن اجرا شود. اما نکته مهم این است که به دلیل چالشهای تفسیر هوش مصنوعی، احتمالاً درک اینکه در غلطیاب خودکار جدید چه مشکلی پیش میآید، بسیار دشوارتر از مدلهای قبلی خواهد بود. چرچ میگوید: «یک حوزه کامل وجود دارد به نام توضیحپذیری، تفسیرپذیری، که در آن مردم میخواهند بفهمند چگونه کار میکند. با روشهای قدیمیتر، شما واقعاً میتوانید پاسخی در مورد آنچه در حال وقوع است، دریافت کنید. جدیدترین و بهترین چیزها تا حدودی شبیه جادو هستند. آنها خیلی بهتر از موارد قدیمی کار میکنند. اما وقتی خراب میشوند، واقعاً بد هستند.»
این موضوع به ریاضیات مربوط میشود: کامپیوتر باید به صورت آماری تصمیم بگیرد که آیا منظور شما از «graff» بیشتر «giraffe» (زرافه) بوده است - که فقط دو حرف اختلاف دارد - یا یک همآوا مانند «graph» (گراف). در موارد پیشرفتهتر، غلطیاب خودکار همچنین باید تصمیم بگیرد که آیا کلمه واقعی انگلیسی که استفاده کردهاید، برای متن مناسب است یا خیر، یا اینکه احتمالاً منظور شما این بوده که پسر نوجوانتان در «math» (ریاضی) خوب است و نه «meth» (متآمفتامین). تا چند سال پیش، فناوری پیشرفته «n-grams» بود، سیستمی که آنقدر خوب کار میکرد که بیشتر مردم آن را بدیهی میپنداشتند - مگر زمانی که قادر به تشخیص نامهای کمتر رایج نبود، کلمات نامناسب را با جایگزینهای نارضایتبخش (چیزی که میتواند به طرز آزاردهندهای ناامیدکننده باشد) جایگزین میکرد، یا جملاتی مانند «delivered a baby in a cab» (نوزادی را در تاکسی زایمان کرد) را به اشتباه به «devoured a baby in a cab» (نوزادی را در تاکسی بلعید) تغییر میداد. به زبان ساده، n-grams نسخه بسیار پایهای از مدلهای زبان بزرگ (LLMs) مدرن مانند ChatGPT هستند. آنها پیشبینیهای آماری در مورد آنچه که احتمالاً خواهید گفت، بر اساس آنچه قبلاً گفتهاید و اینکه چگونه بیشتر مردم جمله شما را کامل میکنند، انجام میدهند. چرچ میگوید استراتژیهای مختلف مهندسی بر دادههایی که غلطیاب خودکار n-gram دریافت میکند، تأثیر میگذارند. اما آنها دیگر پیشرفته نیستند؛ ما در عصر هوش مصنوعی هستیم. پدرسن میگوید پیشنهاد جدید اپل، «مدل زبان ترنسفورمر»، فناوری پیچیدهتری نسبت به غلطیابهای خودکار قدیمی را نشان میدهد. ترنسفورمر یکی از پیشرفتهای کلیدی است که مدلهایی مانند ChatGPT و Gemini را پشتیبانی میکند - این مدلها را در پاسخ به پرسشهای انسانی پیچیدهتر میکند. آنچه این موضوع برای غلطیاب خودکار جدید به همراه دارد، کمتر مشخص است. پدرسن میگوید هر آنچه اپل پیادهسازی کرده باشد، احتمالاً بسیار کوچکتر از مدلهای آشنای هوش مصنوعی خواهد بود - در غیر این صورت نمیتوانست روی تلفن اجرا شود. اما نکته مهم این است که به دلیل چالشهای تفسیر هوش مصنوعی، احتمالاً درک اینکه در غلطیاب خودکار جدید چه مشکلی پیش میآید، بسیار دشوارتر از مدلهای قبلی خواهد بود. چرچ میگوید: «یک حوزه کامل وجود دارد به نام توضیحپذیری، تفسیرپذیری، که در آن مردم میخواهند بفهمند چگونه کار میکند. با روشهای قدیمیتر، شما واقعاً میتوانید پاسخی در مورد آنچه در حال وقوع است، دریافت کنید. جدیدترین و بهترین چیزها تا حدودی شبیه جادو هستند. آنها خیلی بهتر از موارد قدیمی کار میکنند. اما وقتی خراب میشوند، واقعاً بد هستند.»