خواهد گذشته مجرمان Reoffend? انسان ها وحشتناک در حدس زدن و کامپیوتر نیست خیلی بهتر

برای دهه های بسیاری از محققان فکر می کردند که آمار بهتر از انسان ها بودند در پیش بینی اینکه آیا یک منتشر جنایی را تا پایان در زندان است. امروز ریسک تجاری-ارزیابی الگوریتم های کمک دادگاه ها در سراسر کشور با این نوع از پیش بینی. نتایج خود را می توانید اطلاع رسانی چگونه مقامات قانونی تصمیم گیری در صدور قرار وثیقه و پیشنهاد آزادی مشروط. پذیرش گسترده از نیمه خودکار و عدالت ادامه می دهد با وجود این واقعیت است که بیش از چند سال گذشته کارشناسان نگرانی خود دقت و انصاف از این ابزار. اخیرا یک علم پیشرفت مقاله منتشر شده در روز جمعه نشان داد که الگوریتم های انجام شده بهتر از مردم در پيشبينی اگر منتشر کیفری خواهد بود rearrested در عرض دو سال. محققان که مشغول به کار در یک مطالعه قبلی باید در اعتراض به این نتایج ، یک چیز زمان تجزیه و تحلیل توافق بر این است که هیچ کس از نزدیک به کامل—انسان و الگوریتمی پیش بینی می شود نادرست و مغرضانه.

تحقیقات جدید یک پاسخ مستقیم به یک 2018 علم پیشرفت های کاغذ که ندیده انسان انجام می شود و همچنین به عنوان محبوب خطر-ارزیابی نرم افزار به نام تادیبی مجرم مدیریت پروفایل برای جایگزین تحریم (COMPAS) در پیش بینی تکرار جرم سال, و یا اینکه آیا یک محکوم کیفری خواهد reoffend. که مطالعه جلب توجه زیادی در بخشی به دلیل آن را مغایر با درک عقل است. روانشناس بالینی “پل Meehl اظهار داشت: در یک کتاب معروف در سال 1954 که آماری یا آماری پیش بینی تقریبا همیشه بهتر از غیر هدایت شونده قضاوت بشر می گوید:” جان موناهان یک روانشناس در دانشگاه ویرجینیا دانشکده حقوق بود که نه درگیر در مطالعه اخیر اما کار کرده با یکی از نویسندگان آن است. “و در طول شش دهه گذشته نمرات از مطالعات ثابت کرده اند که او حق است.” وقتی 2018 کاغذ بیرون آمد COMPAS را توزیع عدالت کیفری شرکت نرم افزاری Equivant (که قبلا به نام Northpointe) ارسال شده پاسخ رسمی در وب سایت خود را گفت: مطالعه mischaracterized خطر-ارزیابی برنامه و سوال تست روش استفاده می شود. هنگامی که تماس اخیرا توسط علمی آمریکا یک Equivant نماینده هیچ اضافی نظر برای اضافه کردن به این پاسخ است.

برای تست گیری از 2018 مقاله محققان دانشگاه استنفورد و دانشگاه کالیفرنیا در برکلی در ابتدا به دنبال یک روش مشابه. هر دو مطالعه با استفاده از یک مجموعه داده از ارزیابی ریسک انجام شده توسط COMPAS. مجموعه داده های تحت پوشش حدود 7000 متهمان در Broward شهرستان در فلوریدا و شامل هر فرد “عوامل خطر”—برجسته اطلاعاتی مانند جنسیت و سن و جرم و جنایت است که با آن که فرد متهم شد و تعدادی از جرائم قبلی. آن را نیز شامل COMPAS پیش بینی برای اینکه متهم خواهد بود rearrested در عرض دو سال از انتشار و تایید که آیا این پیش بینی درست. از این اطلاعات محققان می تواند سنج COMPAS دقت و صحت. علاوه بر این محققان با استفاده از این اطلاعات برای ایجاد پروفایل یا عکس های شرح داری بر اساس هر متهم و عوامل خطر آنها نشان داد که به چندین صد ندیده انسان های استخدام از طریق Amazon Mechanical Turk پلت فرم. سپس آنها خواسته شرکت کنندگان که آیا آنها فکر می کردند یک فرد در یک شکل خواهد ارتکاب جرم دیگری در عرض دو سال.

این مطالعه از سال 2018 در بر داشت که COMPAS نمایش داده شده حدود 65 درصد دقت و صحت. انسان فردی بودند کمی کمتر درست و ترکیب انسانی برآورد شد و کمی بیشتر از آن. پس از همان روش به عنوان محققان در مقاله اخیر یکی تایید این نتایج. “اولین چیزی که جالب ما متوجه است که ما می تواند در واقع تکرار آزمایش خود می گوید:” Sharad Goel یک از نویسندگان این مطالعه جدید و محاسباتی دانشمندان علوم اجتماعی در دانشگاه استنفورد. “اما پس از آن ما تغییر آزمایش روش های مختلف و ما از گسترش آن به دیگر مجموعه داده.” در طول این دوره از این آزمون های اضافی او می گوید: الگوریتم ها نمایش داده می شود دقت بیشتر از انسان است.

اول Goel و تیم خود را گسترش دامنه اصلی آزمایش. برای مثال آنها آزمایش اینکه آیا دقت را تغییر زمانی که پیش بینی rearrest برای هر جرم در مقابل جرم و جنایت خشونت آمیز. آنها همچنین تجزیه و تحلیل ارزیابی از برنامه های متعدد: COMPAS های مختلف خطر-ارزیابی الگوریتم به نام سطح خدمات Inventory-Revised (LSI-R) و یک مدل است که محققان ساخته شده خود را.

دوم تیم بهینه سازی پارامترهای آن آزمایش را در چند راه. برای مثال مطالعه قبلی به افراد بشر بازخورد پس از آنها ساخته شده و هر پیش بینی اجازه می دهد مردم را به یادگیری بیشتر به عنوان آنها کار کرده است. Goel استدلال می کند که این رویکرد درست نیست به حالات زندگی واقعی. “این نوع از بازخورد فوری امکان پذیر نیست در دنیای واقعی—قضات اصلاح افسران آنها نمی دانند که نتایج برای هفته ها یا ماه پس از تصمیم” او می گوید. بنابراین مطالعه جدید به برخی از افراد بازخورد در حالی که دیگر دریافت هیچ. “آنچه ما در بر داشت وجود دارد این است که اگر ما نمی توانیم به ارائه بازخورد فوری و سپس عملکرد به طور چشمگیری کاهش یافته برای انسان” Goel می گوید.

محققان در پشت این مطالعه اصلی مخالفت با این ایده که بازخورد ارائه خود را آزمایش غیر واقعی است. جولیا Dressel شد در مقطع کارشناسی دانشجوی علوم کامپیوتر در کالج دارتموث زمانی که او مشغول به کار در این مقاله است و در حال حاضر یک مهندس نرم افزار به صورت Recidiviz, یک سازمان غیر انتفاعی است که می سازد تجزیه و تحلیل داده های ابزار برای عدالت کیفری اصلاحات. او اشاره می کند که مردم تورک مکانیکی ممکن است هیچ تجربه با سیستم عدالت کیفری در حالی که افراد پیش بینی رفتار مجرمانه در دنیای واقعی انجام دهد. او همکاری نویسنده هانی فرید یک دانشمند کامپیوتر که مشغول به کار در دارتموث در سال 2018 و که در حال حاضر در U. C. برکلی موافق افرادی که با استفاده از ابزار مانند COMPAS در زندگی واقعی باید تخصص بیشتر نسبت به کسانی که دریافت بازخورد در سال 2018 مطالعه است. “من فکر می کنم آنها در زمان که بازخورد کمی بیش از حد به معنای واقعی کلمه چون مطمئنا قضات و دادستان ها و آزادی مشروط تخته و مشروط افسران باید مقدار زیادی از اطلاعات در مورد افرادی که آنها را جمع آوری در طول سال است. و آنها با استفاده از این اطلاعات در تصمیم گیری” او می گوید.

مقاله جدید نیز تست شده که آیا افشای اطلاعات بیشتر در مورد هر یک بالقوه backslider تغییر دقت پیش بینی. آزمایش اصلی ارائه شده تنها پنج عامل خطر در مورد هر یک متهم به پيشگو. Goel و همکارانش آزمایش این بیماری و مقایسه آن با نتایج زمانی که آنها ارائه 10 عوامل خطر بیشتر. بالاتر-اطلاعات وضعیت بیشتر شبیه به یک دادگاه سناریو زمانی که قضات دسترسی به بیش از پنج قطعه از اطلاعات در مورد هر یک از متهم در دست نیست. Goel مشکوک این سناریو ممکن است سفر کردن انسان ها از آنجا که داده های اضافی می تواند منحرف شود. “این سخت است برای ترکیب همه این چیزها را در یک راه معقول و منطقی” او می گوید. با وجود رزرو محققان دریافتند که انسان دقت همان باقی مانده است اگر چه اطلاعات اضافی می تواند به بهبود الگوریتم عملکرد.

بر روی تنوع وسیع تری از تجربی شرایط مطالعه جدید به این نتیجه رسیدند که الگوریتم های چنین به عنوان COMPAS و LSI-R در واقع بهتر از انسان در پیش بینی خطر است. پیدا کردن این حس به موناهان که تاکید می کند چقدر دشوار است برای افراد تحصیل را به حدس در مورد تکرار جرم سال. “این برای من روشن نیست که چگونه در موقعیت های واقعی زندگی—هنگامی که واقعی قضات در مواجهه با بسیاری از چیزهایی است که می تواند عوامل خطر و زمانی که آنها داده نشده انتقادات و پیشنهادات—چگونه انسان قضات می تواند به عنوان خوب به عنوان الگوریتم های آماری,” او می گوید. اما Goel اخطار می دهد که خود نتیجه گیری به این معنا نیست الگوریتم باید با صراحت کامل به تصویب رسید. “وجود دارد مقدار زیادی از سوالات در مورد استفاده مناسب از ارزیابی ریسک در سیستم عدالت کیفری” او می گوید. “من نفرت برای مردم به دور فکر, ‘الگوریتم های بهتر از انسان است. و بنابراین در حال حاضر ما می توانید تمام خانه بروم.'”

Goel اشاره می کند که محققان هنوز در حال مطالعه چگونه خطر-ارزیابی الگوریتم می توانید رمز نژادی و تعصبات. مثلا COMPAS می گویند که آیا یک فرد ممکن است بازداشت دوباره—اما یکی می تواند دستگیر و بدون داشتن مرتکب یک جرم. “Rearrest برای سطح پایین جرم و جنایت در حال رفتن به دیکته شده توسط که در آن پلیس اتفاق افتاده است” Goel می گوید: “که خود به شدت متمرکز در اقلیت محله.” محققان کشف شده اند میزان بایاس در الگوریتم برای سال. Dressel و فرید هم بررسی چنین مسائلی در سال 2018 کاغذ. “بخشی از مشکل با این ایده که شما در حال رفتن به گرفتن انسان از [این] حلقه و حذف تعصب است: آن است که نادیده گرفتن بزرگ, چاق, عظیم مشکل است که داده های تاریخی است سرند با تعصب—در برابر زنان در برابر مردم از رنگ در برابر تجاوز,” فرید می گوید.

Dressel همچنین اشاره می کند که حتی زمانی که آنها بهتر از انسان, ارزیابی ریسک ابزار آزمایش شده در این مطالعه جدید نیست و باید دقت بسیار بالا. “COMPAS ابزار است که حدود 65 درصد و LSI-R است که حدود 70 درصد دقت و صحت. و هنگامی که شما در حال فکر کردن در مورد چگونه از این ابزار استفاده می شود در دادگاه زمینه که در آن آنها را بسیار عمیق اهمیت است و می تواند بسیار تاثیر زندگی کسی اگر آنها برگزار شد و در زندان به هفته قبل از محاکمه خود—من فکر می کنم که ما باید برگزاری آنها را به یک استاندارد بالاتر از 65 به 70 درصد دقت و به سختی بهتر از انسان پیش بینی.”

اگر چه همه از محققان توافق کردند که الگوریتم باید با احتیاط استفاده شود و نه کورکورانه اعتماد ابزار مانند COMPAS و LSI-R در حال حاضر به طور گسترده ای مورد استفاده در سیستم عدالت کیفری. “من به آن تماس بگیرید, تکنو, مدینه فاضله, این ایده که تکنولوژی فقط حل مشکلات ما” فرید می گوید. “اگر 20 سال گذشته را به ما آموخت هر چیزی [آنها] باید به ما آموخت که به سادگی درست نیست.”

tinyurlis.gdv.gdv.htu.nuclck.ruulvis.netshrtco.detny.im

Leave a reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>