چکیده:
در این مقاله پتانسیل بازی های رایانه ای و شبیه سازی ها در قالب عاملی در برانگیختن سخنان عاطفی به ویژه در تکنولوژیهای سخنرانی با استفاده از کامپیوترComputer based speech technologies بررسی شده است. نتایج اولیه تحلیل شنوایی 30 نمونه که بازیهای رایانه ای تعاملی انجام میدادند، ارائه شده است. این بازی تغییر پیدا کرد تا دو مورد از ابزارهای ارزیابی محرک ها ( رضایت درونی و هدف مداری) که طبق گفته Schere مقدمه ای برای احساسات است، را اجرا کنند.
مقدمه:
پیشرفت های تکنیکی در فرآیند های سیگنالی موجب پیشبرد تکنولوژی های کلامی میشود، که بسیاری از آنها کاربردی و تجاری است. صداشناسی اتوماتیک، تشخیص صدا و سیستم های ترکیب گفتار نمونه هایی از چنین تکنولوژی هایی بوده که میتوانند به طور کاملاً مفیدی در قسمت هایی همچون، تلفن بانک و فعالیتهای اطلاعات کامپیوتری به کار روند. علی رغم سیستم های جاری، پیچیدگی های سیستمها، اعتبارات و سودمندی آنها به عواملی همچون تأثیری که بر گفتار دارد، حالات گذرا، تغییراتی که بر گوینده دارد، ازقبیل استرس فیزیولوژیکی، حالات حسی و نگرش گوینده محدود میشود. تحقیق های قبلی نشان میدهند که این تغییرات در حالات گوینده سیگنالهای کلامی شنیداری را به روش های خاص و پایداری تغییر میدهد. چنین دانشی در تغییرحالات گوینده و تکنولوژی تشخیص صدا منجر به سیستم های قدرتمندی میشود که حاصل انتخاب پارامترها و الگوریتم های پردازشی و نیز توسعه تکنیک های تولید کلام است که حالات گذرا را در گوینده کم میکند. سیستم ترکیب گفتار، که در حال حاضر محدود به صداهای غیرطبیعی است، از اطلاعات نگرشی و احساسی در شکل پارامترهای سوپراسگمنتال Suprasegmental و عروضیprosodic موجود است. همانطور که "مورای و آروت" میگویند، تولیدات بیشتر با کیفیت بالا در سیستم ترکیب گفتارهای احساسی نیازمند یک مدل کامل از فرآیند احساسی شامل اثرات سیستم های عصبی و تغییرات شنوایی است که البته چنین مدلی هنوز موجود نیست.
2. یک رویکرد علمی
بر اساس یکی از مدل هایی که توسط Scherer ارائه شده است، احساس مجموعه ای از فرآیندهای تعاملی ذهنی و فیزیولوژیکی است. در این مدل که بر اساس نظرات روانشناسی ارائه شده است، احساسات نتیجه ارگانیزمی است که مداوماً محیط را بر حسب اهمیت آن برای اهداف، نقشه ها و رفاه و خوشی این ارگانیزم، مورد بررسی قرار میدهد. موقعیت هایی که در آن اتفاقات در محیط مرتبط با ارگانیزیمی ارزیابی میشوند، منجر به یک اپیزود احساسی شده که در آن زیر مجموعه هایی وجود دارد که از نظر کاربردی تطبیق داده شده تا خطرات را کم کرده و فواید را افزایش دهد. Scherer پیشنهاد میدهد که پنج زیر مجموعه وجود دارد که مسئول فعالیتهای ذهنی، عکس العمل های پر معنی و فیزیولوژیک بوده که مطابق اپیزود های احساسی است. عنصر مدل پردازش در پیش بینی های خاص تغییرات فیزیولوژی که ممکن است انواع احساسات را موجب شود، گسترده میشود. این پیش بینی های فیزیولوژیکی با دانش تعامل بین فیزیولوژی صوتی، کیفیت صدا و توصیفات صوتی گفتار ادغام شده تا به پیش بینی های صوتی و آوایی تعدادی از حالات احساسی برسند.
اگرچه این پیش بینیها ساختاری از ابراز احساسات کلامی را ارائه میدهد این مطالعات میتواند در آزمودن فرضیه ها ی خاص به کار گرفته شود. بدین ترتیب باعث میشود که تعبیر و تفسیر فرضیه ها آسان گردد. پیش بینی های Scherer این است که آنها بر اساس لغات احساسی زبان عمومی که اغلب نامفهوم بوده، نیستند. در عوض، حالت گوینده بر حسب ارزیابی او در محیط موردارزیابی قرار میگیرد. با استفاده از این رویکرد نظری میتوان تغییرات کلامی گوینده را در جوانب احساسی مرتبط با موقعیت تفسیر کرد. فواید این این نمونه هنگام بررسی کاربردهای دانش به دست آمده از سناریوهای دنیای واقعی با تکنولوژی های کلامی مدرن کاملاً مشهود است.
3. احساست آنی و برانگیخته شده
Scherer پیشنهاد داده است که اطلاعات صوتی که مرتبط با حالات گوینده هستند، نه تنها به احساسات بستگی ندارد، تغییرات فیزیولوژیکی سیستم تولید گفتار کلامی با تطبیق کنترل شده تولید کلام نیز مرتبط است. هدف در ترکیب گفتار، تغییر بازده سیستم های گفتاری در تولید گفتاری است که احساسی طبیعی به نظر میرسد. گفتار احساسی که از اکترها به دست میآید، برای استفاده در تحقیقات که هدفش افزودن عبارات احساسی در ترکیب گفتار است، مناسب و مطلوب به نظر میرسد.
با تشخیص صدا و سیستم های تأیید گوینده، مشکلی که با احساسات باقی میماند، تغییراتی است که در سخنان گوینده ایجاد میشود و گوینده نمیتواند آن را کنترل کند. حالات احساسی تأثیرگذار منجر به تغییر در سیگنالهای کلامی میشود، که هیچ هدفی را در سیستم های فیزیولوژیکی دنبال نمی کنند. به منظور درک تغییر پذیری سخن با هدف بهبود سخن و سیستم های تشخیص گوینده، لازم است تا سخنرانی های احساسی و نیز سخنانی که در شرایط احساسی واقعی انجام میشود، را آزمایش کرد.
متأسفانه، این نوع تحقیق به دلیل مشکلات اجرایی، بسیار کم انجام میشود. مطالعات میدانی درباره احساسات زندگی واقعی به دلیل اینکه با بسیاری از عواملی که حالات احساسی گوینده را مشخص میکند، مشکل کم انجام میشود. "مارتین" انواع تکنیک هایی که در تجربیات ایجاد احساس مورد استفاده قرار میگیرد را ارائه کرده است. این موارد به طور نمونه شامل تکنیک های ذهنی، ارائه فیلم ها و داستان های احساسی و تکنیک هایی که بر اساس یادآوری تجربیات گذشته است. لزوماً مشکلی که با این تکنیک ها وجود دارد، این است که قیود اخلاقی باعث میشود که تعدادی از احساسات را نتوان ارائه داد.
4. ایجاد احساس با کامپیوتر
اخیراً استفاده از بازیهای رایانهای و شبیه سازی در ایجاد احساسات واقعی نشان داده شده است. توانایی شبیه سازی های رایانه ای به علت نزدیک بودن با زندگی واقعی احساسات متفاوتی را برای فرد به ارمغان میآورد. بازیها و شبیه سازی ها دارای مدل های احساسی بوده که میتواند در شرایط واقعی به کار گرفته شوند. به علاوه بازیها به بازیکن این اختیار را میدهند تا در شرایطی قرار بگیرند که در زندگی واقعی امکان پذیر نیست. تعامل بالا در بازیهای رایانهای احساسات بیشتری را موجب میشوند که در فعالیتهای غیر پویا از قبیل تماشای فیلم نمیتوان یافت. بازیهای رایانهای مدرن با گرافیک و صدای واقعی به این واقعیت افزوده و بازیکن را درگیرتر میکنند. برای یک نقطه نظر تجربی، بازیهای رایانه ای این مزیت را دارند که در محیطهای آزمایشگاه های کنترل شده قابل بازی کردن بوده و قابلیت ضبط سخن را باکیفیت بالا دارند. همچنین یک فایده بازیهای رایانهای این است که میتوان مطابق با فرضیه های تئوریک یک سری حالات احساسی را تغییر داد. به علاوه، بسیاری از عوامل دخیل در زندگی واقعی غیر قابل کنترل بوده که میتوان در بازی های رایانهای کنترل کرد.
گروه تحقیقاتی ما در ژنوا گام های اولیه ای را در استفاده از بازیهای رایانه ای و شبیه سازی ها در ایجاد یک سری از احساسات برداشته است. امید است که سنجش های صوتی به درک حالات فیزیولوژیکی ، روانشناسی و سخن کمک کند. به طور ویژه این مطالعات با هدف کشف اثرات آنی و داوطلبانه احساسات سخنی انجام میشود.
5. طراحی تحقیق
یک سری از مطالعات در حال اجرا است تا تفاوت های صوتی در پاسخ های کلامی تحت کامپیوتر از (بررسی ارزیابی محرک های SECs ) را نتیجه گیری کند. برای این منظور بازی XQuest ) ) انتخاب شد.
در طول بازی، بازیکن با انواع مختلف مشکلات و موانع (کشت های فضایی دشمن)، موانع غیر پویا (معادن دشمنان) و ابزارهای مفید در جهت توانایی ها و قدرتهای خود مواجه میشود. گیمر با استفاده از موس کشتی فضایی را کنترل میکند. بازی برای اهداف مشخص اش (تکمیل هر مرحله ) و نیز امکان استفاده از عناصر بازی مطابق با نتایج SEC انتخاب شده است. تعدادی ویرایشات نیز در بازی انجام شده است. تعدادی از ارزیابی ها در این بازی آورده شده است.
در هر جلسه بازیکن از یک هدفون استفاده کرده و یک ساعت بازی میکند. او باید یک سری گزارشاتی را شفاهاً اعلام کند. گزارشات باید بر اساس یک سری عبارات و کلمات باشد. تعامل با اعضای گروه یک سری سخنان فی البداهه را موجب میشود.
جدول 1: استفاده از SECs در بازیهای رایانه ای
1. تازگی: بالا. اشیائ بازی که قبلاً با آنها روبرو نشده اند، ظاهر میشود.
پایین اشیائ بازی که قبلاً با آنها روبرو شده اند، ظاهر میشود.
2. رضایت درونی: بالا: صداهای خوشایند به همراه حوادث
پایین: صداهای نا خوشایند به همراه حوادث
3. اهمیت هدف/ نیاز:
الف) ارتباط بالا: اشیایی که برای خوب بودن بازیکن حیاتی هستند.
پایین: اشیایی که هیچ ربطی به بازیکن ندارد، ظاهر میشود.
ب) کمک کنندگی: بالا: موضوعات دوستانه و با ارزشند.
پایین: مورد دشمن و مخرب است.
پ) ضرورت: بالا: اغلب سریع پاسخ داده تا در برابر دشمن دفاع و به دوستان کمک کنند.
4. توانایی در کنار آمدن
الف) علت: بررسی بر حسب ارزیابی های صوتی توسط موضوعاتی است که علت یک حادثه است. بنابراین در موارد خاص، موضوع ارزیابی این است که آیا علت حادثه درونی (خود) و یا بیرونی (دیگران) و یا از روی شانس اتفاق افتاده است.
ب) کنترل: بالا: بازیکن کشتی را کاملاً کنترل میکند.
پایین: کنترل سفینه در اثر اختلالاتی با مشکل مواجه میشود.
ج) تعدیل: بالا: بازیکن در صورت آسیب دیدن کشی دیگری نیز دارد.
پایین: بازیکن کشتی دیگری ندارد.
5. سازش پذیری به خود:
الف) استانداردهای بیرونی: بالا. بازیکن یک شی دوست داشتی را نجات میبخشد.
پایین: بازیکن به یک شی دوست داشتی آسیب میرساند.
ب) استانداردهای درونی: بالا. بازیکن در مقابل دشمنان سرسخت به پیروزی میرسد.
پایین: بازیکن دز مقابل دشمنان ضعیف شکست میخورد.
نتایج اولیه:
از ارزیابی نتایج رضایت درونی و هدف مداری مطالعهای گرفته تا تفاوت های صوتی در پاسخ های صوتی بررسی شود. رضایت درونی با استفاده از صداهای خوشایند و غیر خوشایند مورد ارزیابی قرار گرفت. هدف مداری نیز با استفاده از نقاطی در بازی که موجب رسیدن به هدف میشدند (بازیکن به مراحل بالاتر میرود) و یا کاملاً بازیکن را از رسیدن به هدفش باز میدارد (کشتی بازیکن خراب میشود)ارزیابی میشود. همزمان با رسیدن بازیکن به مراحل بالاتر و یا از دست دادن زندگی اش، صداهای خوشایند و غیر خوشایندی به گوش او میرسد. گفتار با استفاده از گزارشات صوتی که در صفحه نمایش نشان داده میشود، ایجاد میشود. از بازیکن خواسته میشود تا اتفاقات را گزارش دهد. این صفحه نمایش میخواهد که حروف و عبارات تلفظ شوند.
نتایج در جدول 1 نشان داده شده است و با جزئیات توضیح داده خواهد شد. قبل از تعمیم دادن کلی این یافته ها باید با جریانات بازی بیشتری مورد آزمایش قرار گیرد. اطلاعات همچنین حاکی از ان است که بازیهای رایانه ای در حالات روانی اثر گذاشته و در نهایت بر گفتار نیز تأثیر گذار هستند. وقفه ای که بین حادثه ایجاد میشد تا بازیکن چیزی را بگوید، خود فاصله ای بود بین حالتی که بازیکن و گفتار او ایجاد میکند. امید آن است که در آینده بتوان با ترکیب گفتار و بازیهای رایانه ای به اهداف بالاتری برسیم.
نمودار در مقاله انگلیسی آمده است..
7. خلاصه تحقیق
این مقاله اهمیت تحقیق در گفتار موثر در تلاش جهت بهبود قدرت تشخیص گفتار و تکنولوژی صداشناسی انجام شده است. ملزومات مطالعه در جهت گفتارهای واقعی، موثر و آنی و نیز مشکلاتی که در اینگونه مطالعات وجود دارد، آورده شده است. برای غلبه بر این مشکلات یک طرح تجربی که درآن از بازیهای رایانهای استفاده میشود تا بر اساس دانش روان شناسی، احساسات برانگیخته شده و در نتیجه گفتار موثر حاصل شود. نتایج اولیه نشان میدهد که میتوان از چنین رویکردی استفاده کرد. امید ان است که این تحقیق دانش بیشتری را در زمینه تاثیر احساس بر گفتار ارائه داده باشد و در مشکلاتی که در اعتبار و سختی تکنولوژی های گفتاری وجود دارد، به کار گرفته شود.
نویسنده: تام جانسون
دانشگاه ژنوا
سال انتشار: 1996