خودکار ‘ادب و انتقال’ نرم بلانت کار پیام

جدید خودکار روش باعث می شود که ارتباطات بیشتر مودب محققان گزارش.

به طور خاص این روش طول می کشد nonpolite دستورات و یا درخواست—کسانی که استفاده از هر دو دفعتا و یا خنثی زبان—و بازسازى آنها و یا اضافه می کند کلمات را به آنها بیشتر خوش اخلاق. “ارسال اطلاعات” به عنوان مثال ممکن است تبدیل به “می تواند به شما لطفا به من داده؟”

ایده انتقال یک سبک یا احساسات از یک ارتباطی به دیگری—منفی اظهارات مثبت به عنوان مثال—چیزی است که زبان فن انجام شده است برای برخی از زمان. Shrimai Prabhumoye یک دانشجوی دکترا در دانشگاه کارنگی ملون زبان موسسه فن آوری (LTI) می گوید: انجام ادب انتقال شده است یک هدف است.

“این است که بسیار مربوط به برخی از برنامه های کاربردی مانند اگر شما می خواهید خود را به ایمیل و یا chatbot صدا بیشتر مودب و یا اگر شما در حال نوشتن یک وبلاگ,” او می گوید. “اما ما هرگز نمی تواند پیدا کردن اطلاعات درست به انجام این کار است.”

او و دانشجویان کارشناسی ارشد, Aman Madaan, Amrith Setlur و Haley Parekh حل این مشکل با تولید یک مجموعه داده از 1.39 میلیون جملات برچسب برای ادب که آنها استفاده می شود برای آزمایش های خود را.

منبع این جملات ممکن است به نظر می رسد تعجب آور است. آنها مشتق شده از ایمیل های رد و بدل شده توسط کارکنان انرون تگزاس مبتنی بر انرژی شرکت است که تا مرگ خود در سال 2001 بود بهتر شناخته شده برای شرکت های بزرگ تقلب و فساد از niceties اجتماعی. اما یک و نیم میلیون شرکت های بزرگ ایمیل های عمومی شد به عنوان یک نتیجه از دعاوی اطراف انرون را به تقلب و رسوایی و پس از آن استفاده شده است به عنوان یک مجموعه داده برای انواع پروژه های تحقیقاتی.

اما حتی با یک مجموعه محققان به چالش کشیده شد به سادگی به تعریف ادب.

“این فقط در مورد استفاده از کلماتی مانند “لطفا” و “متشکرم'” Prabhumoye می گوید. گاهی اوقات آن را به زبان کمی کمتر مستقیم به طوری که به جای گفتن “شما باید انجام دهید X” در این جمله می شود چیزی شبیه به “اجازه دهید ما انجام X.”

و ادب و متفاوت بوده و از یک فرهنگ به بعد. این معمول است برای بومیان آمریکایی شمالی به استفاده از “لطفا” در درخواست به دوستان نزدیک اما در فرهنگ عرب آن را در نظر گرفته بود بی دست و پا اگر نه بی ادب. برای مطالعه محققان محدود کار خود را به سخنرانان از آمریکای شمالی به زبان انگلیسی در یک محیط رسمی.

این ادب مجموعه دادهها به منظور تعيين فراوانی و توزیع کلمات در مودب و nonpolite جملات. پس از آن تیم توسعه “تگ و تولید” خط لوله به انجام ادب نقل و انتقالات. اول دفعتا یا nonpolite کلمات یا عبارات را برچسب زده و سپس یک متن ژنراتور جایگزین هر برچسب در مورد. سیستم طول می کشد مراقبت به تغییر معنای جمله.

“این فقط در مورد تمیز کردن فحش” Prabhumoye می گوید از این روند است. در ابتدا این سیستم تا به حال تمایل به سادگی اضافه کردن کلمات به جمله مانند “لطفا” یا “متاسفم.” اگر “لطفا به من کمک کن” در نظر گرفته شد مودب سیستم در نظر گرفته شود “لطفا لطفا لطفا به من کمک کند” و حتی بیشتر مودب.

اما با گذشت زمان سیستم نمره دهی شد واقع بینانه تر و تغییرات شد و زیرکانه. اول شخص مفرد ضمایر, مانند, من, من و مال من بودند جای اول شخص جمع ضمایر مانند ما به ما و ما. و نه از موقعیت “لطفا” در ابتدای جمله سیستم های آموخته شده برای قرار دادن آن در جمله: “می تواند به شما لطفا به من فایل؟”

Prabhumoye می گوید: محققان منتشر شده خود را با برچسب مجموعه داده برای استفاده توسط محققان دیگر امید به آنها را تشویق به مطالعه بیشتر ادب.

محققان حاضر در مطالعه خود در ادب انتقال در Association for Computational Linguistics نشست سالانه.

نیروی هوایی آزمایشگاه تحقیقاتی دفتر تحقیقات نیروی دریایی بنیاد ملی علوم اپل و انویدیا پشتیبانی این پژوهش است.

منبع: دانشگاه کارنگی ملون

tinyurlis.gdclck.ruulvis.netshrtco.de