11-02-2019، 13:32
دانشمندان در آزمایشی منحصربفرد توانستند سیگنالهای مغز را به طور مستقیم به گفتار قابل فهم تبدیل کنند. شاید در نگاه اول چیزی بیش از ایده علمی – تخیلی به نظر نیاید، اما این دستاورد می تواند به کمکِ افرادی بیاید که مشکلات گفتاری دارند. افزون بر این، ما می توانیم در آینده با این دستاورد به میانجیهای رایانهای مفید و مهمی دست پیدا کنیم.
به گزارش بیگ بنگ، یک الگوریتم هوش مصنوعی در این سیستم نقش کلیدی ایفا می کند. با این الگوریتم، آنچه فرد می شنود با الگوی فعالیت الکتریکی مطابقت پیدا می کند و سپس آنها به کمک الگوریتم به گفتاری تبدیل می شوند که واقعا برای شنونده قابل درک و منطقی به نظر می رسد. ما از تحقیقات قبلی می دانیم که وقتی حرف می زنیم، الگوهای متمایزی در شبکههای عصبی مغز شکل می گیرند. در این مورد، سیستم به رمزگشایی واکنشهای مغز می پردازد، نه اینکه افکار حقیقی را به گفتار تبدیل کند. اما این قابلیت را هم دارد، فقط به پیشرفت بیشتری در این زمینه نیاز است.
«نیما مسگرانی»، نویسنده و محقق از دانشگاه کلمبیا در نیویورک بیان کرد: «صدایمان به ما کمک می کند تا با دوستان، خانواده و دنیای پیرامون خود پیوند برقرار کنیم. به همین خاطر است که از دست دادن قدرت تولید صدا به دلیل آسیب یا بیماری، خیلی دردناک و مخرب است. ما با انجام مطالعات جدید، به راهکار بالقوهای برای احیای آن قدرت دست یافتهایم. ما نشان دادیم که با فناوری مناسب، افکار این افراد میتواند رمزگشایی شده و توسط هر شنوندهای فهمیده شود.»
الگوریتمِ مورد استفاده «vocoder» نام دارد؛ یعنی همان نوع الگوریتمی که میتواند گفتار را پس از دیدنِ آموزشهایی دربارۀ حرف زدن انسان تولید کند. وقتی پاسخی از «سیری» یا «اَلِکسا» می شنوید، باید بدانید که در آن لحظه از الگوریتم «vocoder» استفاده می شود. به عبارت دیگر، آمازون یا اپل نیازی ندارند تا تمامی کلمات را در دستگاههای خود برنامهنویسی کنند؛ آنها از این الگوریتم برای تولید صدای واقعگرایانه استفاده می کنند. در اینجا، الگوریتم «vocoder» نه با گفتار انسان، بلکه با فعالیت عصبی در بخش کورتکس شنیداری مغز آموزش دیده است.
این فعالیت در بیمارانی که جراحی مغزی در آنها انجام می شود و در عین حال جملاتی با صدای بلند برایشان پخش می شود، اندازهگیری می شود. با این بانک دادهای، همزمان که بیماران به اعداد ۰ تا ۹ با صدای بلند گوش می دادند، سیگنالهای مغز ثبت شده و این الگوریتم به کار برده می شود. سپس، با انجام تجزیه و تحلیلهای جامع هوش مصنوعی، بررسیهای دقیقتری صورت می گیرد. سیگنالهای ثبت شده مطابقت خوبی با صداهای شنیده شده داشتند. این روش بسیار قدرتمندتر و موثرتر از روشهای قبلی بود. در روشهای قبلی از مدلهای کامپیوتری سادهتر استفاده می شد.
مِسگرانی در ادامه افزود: «ما دریافتیم که افراد می توانند تقریبا در ۷۵ درصد از مواقع صداها را درک کرده و تکرار کنند؛ یعنی خیلی بهتر و بیشتر از دفعات قبلی. این نتیجه برای ما کاملا دور از انتظار بود. این برنامۀ حساس و شبکههای عصبی قوی، صداهایی را که بیماران به آنها گوش داده بودند را با دقتی شگفتانگیز، ارائه کردند. » هنوز کارهای زیادی برای انجام دادن وجود دارد، اما این دستاورد میتواند پتانسیلهای فراوانی را به ارمغان بیاورد. بار دیگر باید به این نکته تاکید کرد که سیستم افکار ذهنی را به گفتار تبدیل نمی کند، اما شاید روزی بتواند از پسِ انجام این کار هم بر بیاید. این همان چالشی است که محققان می خواهند در آینده بر آن فائق آیند. شاید روزی فرا برسد که با صدور یک فرمان ذهنی، چراغهای گوشی هوشمند خود را روشن کنید.
البته بدیهی است که این کار به زمان بیشتری نیاز دارد و باید در آینده چنین اتفاقی می افتد یا خیر. در آیندهای نه چندان دور، شاید برخی بیماران بتوانند افکار خود را با سیستم فوقالذکر به گفتار تبدیل کرده و قسمت عمدهای از نیازهای خود را برطرف نمایند. این دستاورد می تواند تحولی عظیم و قابل توجه باشد. برای کسی که قدرت تکلم و صدایش را از دست داده است، باورِ چنین دستاوردی فراتر از ذهن است. آنان می توانند در این صورت بار دیگر با دنیای پیرامون خود ارتباط مستمر برقرار کنند. جزئیات بیشتر این مقاله پژوهشی در Scientific Reports منتشر شده است.
دیدن لینک ها برای شما امکان پذیر نیست. لطفا ثبت نام کنید یا وارد حساب خود شوید تا بتوانید لینک ها را ببینید.
به گزارش بیگ بنگ، یک الگوریتم هوش مصنوعی در این سیستم نقش کلیدی ایفا می کند. با این الگوریتم، آنچه فرد می شنود با الگوی فعالیت الکتریکی مطابقت پیدا می کند و سپس آنها به کمک الگوریتم به گفتاری تبدیل می شوند که واقعا برای شنونده قابل درک و منطقی به نظر می رسد. ما از تحقیقات قبلی می دانیم که وقتی حرف می زنیم، الگوهای متمایزی در شبکههای عصبی مغز شکل می گیرند. در این مورد، سیستم به رمزگشایی واکنشهای مغز می پردازد، نه اینکه افکار حقیقی را به گفتار تبدیل کند. اما این قابلیت را هم دارد، فقط به پیشرفت بیشتری در این زمینه نیاز است.
«نیما مسگرانی»، نویسنده و محقق از دانشگاه کلمبیا در نیویورک بیان کرد: «صدایمان به ما کمک می کند تا با دوستان، خانواده و دنیای پیرامون خود پیوند برقرار کنیم. به همین خاطر است که از دست دادن قدرت تولید صدا به دلیل آسیب یا بیماری، خیلی دردناک و مخرب است. ما با انجام مطالعات جدید، به راهکار بالقوهای برای احیای آن قدرت دست یافتهایم. ما نشان دادیم که با فناوری مناسب، افکار این افراد میتواند رمزگشایی شده و توسط هر شنوندهای فهمیده شود.»
الگوریتمِ مورد استفاده «vocoder» نام دارد؛ یعنی همان نوع الگوریتمی که میتواند گفتار را پس از دیدنِ آموزشهایی دربارۀ حرف زدن انسان تولید کند. وقتی پاسخی از «سیری» یا «اَلِکسا» می شنوید، باید بدانید که در آن لحظه از الگوریتم «vocoder» استفاده می شود. به عبارت دیگر، آمازون یا اپل نیازی ندارند تا تمامی کلمات را در دستگاههای خود برنامهنویسی کنند؛ آنها از این الگوریتم برای تولید صدای واقعگرایانه استفاده می کنند. در اینجا، الگوریتم «vocoder» نه با گفتار انسان، بلکه با فعالیت عصبی در بخش کورتکس شنیداری مغز آموزش دیده است.
این فعالیت در بیمارانی که جراحی مغزی در آنها انجام می شود و در عین حال جملاتی با صدای بلند برایشان پخش می شود، اندازهگیری می شود. با این بانک دادهای، همزمان که بیماران به اعداد ۰ تا ۹ با صدای بلند گوش می دادند، سیگنالهای مغز ثبت شده و این الگوریتم به کار برده می شود. سپس، با انجام تجزیه و تحلیلهای جامع هوش مصنوعی، بررسیهای دقیقتری صورت می گیرد. سیگنالهای ثبت شده مطابقت خوبی با صداهای شنیده شده داشتند. این روش بسیار قدرتمندتر و موثرتر از روشهای قبلی بود. در روشهای قبلی از مدلهای کامپیوتری سادهتر استفاده می شد.
مِسگرانی در ادامه افزود: «ما دریافتیم که افراد می توانند تقریبا در ۷۵ درصد از مواقع صداها را درک کرده و تکرار کنند؛ یعنی خیلی بهتر و بیشتر از دفعات قبلی. این نتیجه برای ما کاملا دور از انتظار بود. این برنامۀ حساس و شبکههای عصبی قوی، صداهایی را که بیماران به آنها گوش داده بودند را با دقتی شگفتانگیز، ارائه کردند. » هنوز کارهای زیادی برای انجام دادن وجود دارد، اما این دستاورد میتواند پتانسیلهای فراوانی را به ارمغان بیاورد. بار دیگر باید به این نکته تاکید کرد که سیستم افکار ذهنی را به گفتار تبدیل نمی کند، اما شاید روزی بتواند از پسِ انجام این کار هم بر بیاید. این همان چالشی است که محققان می خواهند در آینده بر آن فائق آیند. شاید روزی فرا برسد که با صدور یک فرمان ذهنی، چراغهای گوشی هوشمند خود را روشن کنید.
البته بدیهی است که این کار به زمان بیشتری نیاز دارد و باید در آینده چنین اتفاقی می افتد یا خیر. در آیندهای نه چندان دور، شاید برخی بیماران بتوانند افکار خود را با سیستم فوقالذکر به گفتار تبدیل کرده و قسمت عمدهای از نیازهای خود را برطرف نمایند. این دستاورد می تواند تحولی عظیم و قابل توجه باشد. برای کسی که قدرت تکلم و صدایش را از دست داده است، باورِ چنین دستاوردی فراتر از ذهن است. آنان می توانند در این صورت بار دیگر با دنیای پیرامون خود ارتباط مستمر برقرار کنند. جزئیات بیشتر این مقاله پژوهشی در Scientific Reports منتشر شده است.