گوگل از هوش مصنوعی InkSight رونمایی کرد؛ تبدیل دست‌نوشته به متن دیجیتال

گوگل از هوش مصنوعی InkSight رونمایی کرد

فهرست مطالب

گوگل از سیستم هوش مصنوعی جدیدی رونمایی کرده که دست‌نوشته‌ را به متن دیجیتالی قابل ویرایش تبدیل می‌کند. این مدل می‌تواند دست خط شما را شبیه‌سازی کرده و حتی طرح و نقش‌ها را هم بازسازی کند. 

متون دیجیتال نسبت به دست‌نویس مزایای متعددی مثل ذخیره آنلاین، ویرایش آسان، قابلیت جستجو، اشتراک گذاری سریع و غیره دارند، اما تحقیقات نشان داده هنوز هم اکثر افراد استفاده از قلم و کاغذ را ترجیح می‌دهند. حالا واحد تحقیقات گوگل هوش مصنوعی (هوش مصنوعی چیست؟) جدیدی به نام InkSight توسعه داده که می‌تواند سال‌ها تلاش دانشمندان برای پیوند دست‌نوشته‌ها و متون دیجیتال را به ثمر بنشاند. 

 

هوش مصنوعی گوگل InkSight چطور کار می‌کند؟

تا کنون روش‌های متعددی مثل OCR برای تبدیل دست‌نوشته به متن دیجیتال ارائه شده اما آنچه که InkSight را از دیگر روش‌ها متمایز می‌کند، شیوه کار خاص آن است.  روش‌های دیگر برای تشخیص متن تا حد زیادی به تحلیل ویژگی‌های هندسی خطوط متکی هستند و مسیر خط را روی صفحه دنبال می‌کنند. InkSight اما از قابلیت‌های پیچیده AI برای خواندن و درک متن و همچنین بازتولید طبیعی آن بهره می‌برد.

به عبارت دیگر هوش مصنوعی گوگل متن دست‌نویس را با همان دست‌خط، فونت و اندازه بازتولید می‌کند. حتی اگر نوشته تاریک، بد خط، با پس زمینه شلوغ و تا حدودی مخفی هم باشد، برای هوش مصنوعی قابل تشخیص است. این مدل حتی طرح و نقش‌های ساده را نیز با برخی محدودیت‌ها به صورت دیجیتال درمی‌آورد. 

گوگل از هوش مصنوعی InkSight

مدل InkSight طی آزمایش‌های صورت گرفته در ۸۷ درصد موارد متن را با دقت بالا دیجیتالی کرده است. در ۶۷ موارد نیز خروجی هوش مصنوعی گوگل به حدی به متن اصلی شبیه بوده که از هم قابل تشخیص نبوده‌اند. محققان پروژه در این باره گفته‌اند: «این اولین سیستمی است که عکس‌های متون دست‌نویس را با ویژگی های بصری و پس زمینه‌های متنوع به خوبی رندر می‌کند.»

نکته جالب توجه معماری ساده این مدل است که بر پایه ابزارهایی در دسترس عموم از جمله مبدل تصویر گوگل (ViT)  و مدل زبانی mT5 توسعه پیدا کرده است. 

 

هوش مصنوعی تبدیل دست‌نوشته به متن دیجیتال چه کاربردهایی دارد؟

فناوری InkSight گوگل پل ارتباطی بین یادداشت‌برداری سنتی و دنیای دیجیتال است. این فناوری نه تنها کارها را راحت‌تر می‌کند، بلکه به ما کمک می‌کند تا اطلاعات ارزشمند را حفظ کرده و به نسل‌های آینده منتقل کنیم.

تصور کنید مثل همیشه با خودکار بیک آبی روی کاغذ بنویسید امایادداشت‌هایتان به صورت دیجیتال هم در دسترس باشند. این یعنی می‌توانید به راحتی در نوشته‌‌های قبلی سرچ کنید، آنها را بازنویسی کرده یا به راحتی برای دیگران بفرستید.

دانشجوها با این فناوری هم از مزایای یادداشت‌برداری دستی (مثل بهتر یاد گرفتن مطالب) و هم از مزایای یادداشت‌برداری دیجیتال بهره‌مند می‌شوند. محققان و مورخان هم با کمک InkSight اسناد قدیمی دست‌نویس را به صورت دیجیتال آرشیو کرده و به راحتی آن‌ها را مطالعه و تحلیل خواهند کرد. 

اما شاید مهم‌ترین کاربرد این فناوری احیا، حفظ و نگهداری زبان‌های کمتر شناخته شده باشد. دکتر «کلودیو موسات»، یکی از محققان پروژه می‌گوید: «با این سیستم به کامپیوترها یاد می‌دهیم که دست‌نوشته‌های به این زبان‌ها را بخوانند و درک کنند.» 

 

دسترسی به هوش مصنوعی InkSight 

گوگل نسخه‌ی عمومی این مدل را منتشر کرده است، اما برای جلوگیری از سوءاستفاده‌های بالقوه مانند جعل برخی قابلیت‌‌ها محدود شده است. برای تست آن می‌توانید از نسخه دمو در سایت Hugging Face استفاده کنید. بازخورد اولیه بسیار مثبت بوده و کاربران توانایی سیستم در حفظ دست‌خط نویسنده را تحسین کرده‌اند. 

اپراتور هوش مصنوعی اهورا با ارائه پلتفرم پردازش گرافیکی Jupyter Notebook گام بلندی در راستای پیشرفت هوش مصنوعی در ایران برداشته است. و با ارائه خدماتی مثل پردازش گرافیکی ابری، ذخیره‌سازی هوش مصنوعی و مشاوره تخصصی، پاسخگوی همه‌ جانبهٔ نیازهای متنوع مشتریان حوزه هوش مصنوعی است.

 

منبع

Venturebeat

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دوازده + پنج =