آیا هوش مصنوعی پاسخی برای خدمات عمومی بهتر است؟


پا پیتر گارسیا، گزارشگر فناوری

Getty Images تلفن هوشمندی که کد را نشان می‌دهد و سر کارتونی در بالا داردگتی ایماژ

دولت ها در حال بررسی هستند که آیا هوش مصنوعی می تواند توصیه های قابل اعتمادی ارائه دهد یا خیر

مدت ها قبل از ظهور ChatGPT، دولت ها به دنبال استفاده از ربات های چت برای خودکارسازی خدمات و مشاوره های خود بودند.

کالین ون نوردت، محقق هلندی در مورد استفاده از هوش مصنوعی در دولت، می‌گوید: این چت‌بات‌های اولیه «به طور کلی ساده‌تر و با قابلیت‌های مکالمه محدود بودند».

اما ظهور هوش مصنوعی مولد در دو سال گذشته چشم انداز یک سرویس عمومی کارآمدتر را احیا کرده است، جایی که مشاوران شبیه انسان می توانند شبانه روزی کار کنند و به سؤالات مربوط به مزایا، مالیات ها و سایر زمینه هایی که دولت با آنها در تعامل است پاسخ دهند. عموم.

هوش مصنوعی مولد به اندازه کافی پیچیده است که بتواند پاسخ هایی شبیه به انسان ارائه دهد و اگر بر روی داده های باکیفیت کافی آموزش داده شود، از نظر تئوری می تواند طیف گسترده ای از سوالات مربوط به خدمات عمومی را حل کند.

اما هوش مصنوعی مولد به دلیل اشتباهات یا حتی پاسخ‌های بی‌معنی – به اصطلاح توهم – شناخته شده است.

در بریتانیا، سرویس دیجیتال دولتی (GDS) آزمایش‌هایی را از ربات چت GOV.UK مبتنی بر ChatGPT انجام داده است که به سؤالات شهروندان در مورد طیف وسیعی از مسائل مربوط به خدمات دولتی پاسخ می‌دهد.

در یک پست وبلاگ در مورد اولین یافته های خودآژانس خاطرنشان کرد که تقریباً 70 درصد از شرکت کنندگان در کارآزمایی پاسخ ها را مفید می دانستند.

با این حال، مشکلاتی در مورد “چندین” از سیستم تولید اطلاعات نادرست و ارائه آن به عنوان واقعیت وجود داشت.

این وبلاگ همچنین ابراز نگرانی کرد که ممکن است اعتماد نابجا به سیستم وجود داشته باشد، که گاهی اوقات ممکن است باعث اشتباه شود.

«به طور کلی، پاسخ‌ها از بالاترین سطح دقت مورد نیاز برای سایتی مانند GOV.UK، که در آن دقت واقعی بسیار مهم است، کمتر بود. ما به سرعت این آزمایش را تکرار می کنیم تا مشکلات دقت و قابلیت اطمینان را برطرف کنیم.

Getty Images پرچم پرتغال در خارج از ساختمان پارلمان در لیسبونگتی ایماژ

پرتغال در حال آزمایش یک چت بات مبتنی بر هوش مصنوعی است

کشورهای دیگر نیز در حال آزمایش سیستم های مبتنی بر هوش مصنوعی مولد هستند.

پرتغال راهنمای عملی عدالت را در سال 2023 راه اندازی کرد، یک ربات چت که برای پاسخ به سؤالات اساسی در مورد موضوعات ساده مانند ازدواج و طلاق طراحی شده است. ربات چت با بودجه صندوق بازیابی و مقاومت اتحادیه اروپا (RRF) توسعه یافته است.

پروژه 1.3 میلیون یورویی (1.4 میلیون دلار؛ 1.1 میلیون پوند) بر اساس مدل زبان OpenAI GPT 4.0 است. علاوه بر ازدواج و طلاق، اطلاعاتی در مورد تشکیل شرکت نیز ارائه می دهد.

به گفته وزارت دادگستری پرتغال، 28608 سوال در راهنما در 14 ماه اول پروژه مطرح شده است.

وقتی از او سوال اساسی پرسیدم “چگونه می توانم یک شرکت راه اندازی کنم”، او خوب کار کرد.

اما وقتی از چیز پیچیده‌تری پرسیدم: «اگر زیر 18 سال دارم اما متاهل هستم، می‌توانم شرکتی راه‌اندازی کنم؟»، او به خاطر نداشتن اطلاعات برای پاسخ به این سؤال عذرخواهی کرد.

یک منبع وزارت اذعان می کند که آنها هنوز اعتماد ندارند، اگرچه پاسخ های اشتباه نادر است.

این منبع به من گفت: “ما امیدواریم با افزایش شدید سطح اطمینان پاسخ ها بر این محدودیت ها غلبه کنیم.”

کالین ون نوردت کالین ون نوردت، محقق در مورد استفاده از هوش مصنوعی در دولت از هلندکالین ون نورد

به گفته کالین ون نورد، چت بات ها نباید جایگزین کارمندان دولتی شوند

چنین نقص هایی به این معنی است که بسیاری از کارشناسان توصیه می کنند احتیاط کنند – از جمله کالین ون نورد. زمانی که چت بات ها به عنوان راهی برای جایگزینی انسان ها و کاهش هزینه ها استفاده می شوند، اشتباه می شود.

او می افزاید، رویکرد معقول تر این است که آنها را به عنوان “یک سرویس اضافی، راهی سریع برای یافتن اطلاعات” ببینیم.

Sven Nyholm، استاد اخلاق هوش مصنوعی در دانشگاه لودویگ ماکسیمیلیان مونیخ، بر موضوع پاسخگویی تاکید دارد.

او می گوید: «یک ربات چت با یک کارمند دولتی قابل تعویض نیست. – انسان می تواند در قبال اعمال خود مسئول و از نظر اخلاقی مسئول باشد.

چت ربات‌های هوش مصنوعی نمی‌توانند در قبال کاری که انجام می‌دهند، مسئول شناخته شوند. مدیریت دولتی نیاز به پاسخگویی دارد و از این رو به مردم نیاز دارد.»

آقای Nyholm همچنین موضوع قابلیت اطمینان را برجسته می کند.

«انواع جدید چت بات ها توهم هوش و خلاقیت را ایجاد می کنند، که انواع قبلی چت بات ها این توهم را نداشتند.

گاهی اوقات، این اشکال جدیدتر و تاثیرگذارتر چت‌بات‌ها اشتباهات احمقانه و احمقانه‌ای مرتکب می‌شوند – گاهی اوقات ممکن است طنزآمیز باشد، اما زمانی که مردم به توصیه‌های آن‌ها تکیه می‌کنند، می‌تواند بالقوه خطرناک باشد.

Getty Images برج‌های دوقلو ورودی شهر قدیمی تالین، استونی را نشان می‌دهندگتی ایماژ

دولت استونی در استفاده از چت بات ها پیشرو است

اگر ChatGPT و دیگر مدل‌های زبان بزرگ (LLM) آماده ارائه توصیه‌های مهم نیستند، شاید بتوانیم به دنبال جایگزینی در استونی باشیم.

هنگامی که صحبت از دیجیتالی کردن خدمات عمومی می شود، استونی یکی از پیشتازان بوده است. این شرکت از اوایل دهه 1990 خدمات دیجیتالی را توسعه داده است و در سال 2002 کارت شناسایی دیجیتالی را معرفی کرد که به شهروندان امکان دسترسی به خدمات دولتی را می دهد.

بنابراین، جای تعجب نیست که استونی در خط مقدم اجرای چت بات ها قرار دارد.

این کشور در حال حاضر در حال توسعه مجموعه ای از چت بات ها برای خدمات عمومی به نام Bürokratt است.

با این حال، چت ربات‌های استونیایی مبتنی بر مدل‌های زبان بزرگ (LLM) مانند ChatGPT یا Google Gemini نیستند.

در عوض، آنها از پردازش زبان طبیعی (NLP) استفاده می کنند، یک فناوری که قبل از آخرین موج هوش مصنوعی است.

الگوریتم NLP استونیایی درخواست را به بخش‌های کوچک تقسیم می‌کند، کلمات کلیدی را شناسایی می‌کند و از آن استنباط می‌کند که کاربر چه می‌خواهد.

در Bürokratt، بخش‌ها از داده‌های خود برای آموزش ربات‌های چت و اعتبارسنجی پاسخ‌های آن‌ها استفاده می‌کنند.

کای کالاس، رئیس خدمات شخصی در اداره سیستم اطلاعات استونی می‌گوید: «اگر Bürokratt پاسخ را نداند، چت به یک نماینده پشتیبانی منتقل می‌شود که چت را به عهده می‌گیرد و به صورت دستی پاسخ می‌دهد.

این یک سیستم با پتانسیل محدودتر از سیستم مبتنی بر ChatGPT است، زیرا مدل های NLP در توانایی خود برای تقلید گفتار انسان و تشخیص نکات ظریف در زبان محدود هستند.

با این حال، بعید است که پاسخ های اشتباه یا گمراه کننده بدهند.

«برخی از اولین ربات‌های گفتگو، شهروندان را مجبور می‌کردند گزینه‌هایی را برای سؤالات انتخاب کنند. کالین ون نوردت توضیح می‌دهد که در عین حال، کنترل و شفافیت بیشتری را در نحوه عملکرد و پاسخ ربات چت فراهم می‌کند.

ربات‌های چت مبتنی بر LLM اغلب کیفیت مکالمه بسیار بالاتری دارند و می‌توانند پاسخ‌های ظریف‌تری ارائه دهند.

او می افزاید: “با این حال، این به قیمت کنترل کمتر بر سیستم است و همچنین ممکن است پاسخ های متفاوتی را برای یک سوال ارائه دهد.”

فناوری کسب و کار بیشتر

دیدگاهتان را بنویسید