گوگل از سیستم هوش مصنوعی جدیدی رونمایی کرده که دستنوشته را به متن دیجیتالی قابل ویرایش تبدیل میکند. این مدل میتواند دست خط شما را شبیهسازی کرده و حتی طرح و نقشها را هم بازسازی کند.
متون دیجیتال نسبت به دستنویس مزایای متعددی مثل ذخیره آنلاین، ویرایش آسان، قابلیت جستجو، اشتراک گذاری سریع و غیره دارند، اما تحقیقات نشان داده هنوز هم اکثر افراد استفاده از قلم و کاغذ را ترجیح میدهند. حالا واحد تحقیقات گوگل هوش مصنوعی (هوش مصنوعی چیست؟) جدیدی به نام InkSight توسعه داده که میتواند سالها تلاش دانشمندان برای پیوند دستنوشتهها و متون دیجیتال را به ثمر بنشاند.
هوش مصنوعی گوگل InkSight چطور کار میکند؟
تا کنون روشهای متعددی مثل OCR برای تبدیل دستنوشته به متن دیجیتال ارائه شده اما آنچه که InkSight را از دیگر روشها متمایز میکند، شیوه کار خاص آن است. روشهای دیگر برای تشخیص متن تا حد زیادی به تحلیل ویژگیهای هندسی خطوط متکی هستند و مسیر خط را روی صفحه دنبال میکنند. InkSight اما از قابلیتهای پیچیده AI برای خواندن و درک متن و همچنین بازتولید طبیعی آن بهره میبرد.
به عبارت دیگر هوش مصنوعی گوگل متن دستنویس را با همان دستخط، فونت و اندازه بازتولید میکند. حتی اگر نوشته تاریک، بد خط، با پس زمینه شلوغ و تا حدودی مخفی هم باشد، برای هوش مصنوعی قابل تشخیص است. این مدل حتی طرح و نقشهای ساده را نیز با برخی محدودیتها به صورت دیجیتال درمیآورد.
مدل InkSight طی آزمایشهای صورت گرفته در ۸۷ درصد موارد متن را با دقت بالا دیجیتالی کرده است. در ۶۷ موارد نیز خروجی هوش مصنوعی گوگل به حدی به متن اصلی شبیه بوده که از هم قابل تشخیص نبودهاند. محققان پروژه در این باره گفتهاند: «این اولین سیستمی است که عکسهای متون دستنویس را با ویژگی های بصری و پس زمینههای متنوع به خوبی رندر میکند.»
نکته جالب توجه معماری ساده این مدل است که بر پایه ابزارهایی در دسترس عموم از جمله مبدل تصویر گوگل (ViT) و مدل زبانی mT5 توسعه پیدا کرده است.
هوش مصنوعی تبدیل دستنوشته به متن دیجیتال چه کاربردهایی دارد؟
فناوری InkSight گوگل پل ارتباطی بین یادداشتبرداری سنتی و دنیای دیجیتال است. این فناوری نه تنها کارها را راحتتر میکند، بلکه به ما کمک میکند تا اطلاعات ارزشمند را حفظ کرده و به نسلهای آینده منتقل کنیم.
تصور کنید مثل همیشه با خودکار بیک آبی روی کاغذ بنویسید امایادداشتهایتان به صورت دیجیتال هم در دسترس باشند. این یعنی میتوانید به راحتی در نوشتههای قبلی سرچ کنید، آنها را بازنویسی کرده یا به راحتی برای دیگران بفرستید.
دانشجوها با این فناوری هم از مزایای یادداشتبرداری دستی (مثل بهتر یاد گرفتن مطالب) و هم از مزایای یادداشتبرداری دیجیتال بهرهمند میشوند. محققان و مورخان هم با کمک InkSight اسناد قدیمی دستنویس را به صورت دیجیتال آرشیو کرده و به راحتی آنها را مطالعه و تحلیل خواهند کرد.
اما شاید مهمترین کاربرد این فناوری احیا، حفظ و نگهداری زبانهای کمتر شناخته شده باشد. دکتر «کلودیو موسات»، یکی از محققان پروژه میگوید: «با این سیستم به کامپیوترها یاد میدهیم که دستنوشتههای به این زبانها را بخوانند و درک کنند.»
دسترسی به هوش مصنوعی InkSight
گوگل نسخهی عمومی این مدل را منتشر کرده است، اما برای جلوگیری از سوءاستفادههای بالقوه مانند جعل برخی قابلیتها محدود شده است. برای تست آن میتوانید از نسخه دمو در سایت Hugging Face استفاده کنید. بازخورد اولیه بسیار مثبت بوده و کاربران توانایی سیستم در حفظ دستخط نویسنده را تحسین کردهاند.
اپراتور هوش مصنوعی اهورا با ارائه پلتفرم پردازش گرافیکی Jupyter Notebook گام بلندی در راستای پیشرفت هوش مصنوعی در ایران برداشته است. و با ارائه خدماتی مثل پردازش گرافیکی ابری، ذخیرهسازی هوش مصنوعی و مشاوره تخصصی، پاسخگوی همه جانبهٔ نیازهای متنوع مشتریان حوزه هوش مصنوعی است.
منبع