جای خالی اعداد

تمرکز، شفافیت و حاکمیت داده پیش شرط‌های واقعی تحول دیجیتال هستند

مدیر‌ واحد‌ هوش‌مصنوعی‌ شرکت‌ سیمرغ‌ بیمه‌ ایران
تاریخ: 14 دی 1404
شناسه: 1115

یکی از بزرگ‌ترین چالش‌های داده‌ای در صنعت بیمه، نبود یک ساختار پیوسته و متمرکز برای نگهداری تاریخچه بیمه‌نامه‌هاست. با تغییر شرکت بیمه از سوی مشتریان، بخش مهمی از سوابق و اطلاعات آن‌ها از دست می‌رود. این گسست اطلاعاتی نه‌تنها امکان تحلیل دقیق داده‌ها را کاهش می‌دهد، بلکه تشخیص تقلب را نیز با دشواری جدی مواجه می‌کند؛ چراکه زنجیره اطلاعات به‌صورت کامل در دسترس هیچ‌یک از شرکت‌ها نیست.

در این میان، شکاف اطلاعاتی میان شرکت‌های بیمه کوچک و بزرگ نیز وضعیت را پیچیده‌تر می‌کند. شرکت‌های کوچک به‌دلیل حجم محدود داده، امکان بهره‌برداری مؤثر از تحلیل‌های مبتنی بر هوش مصنوعی را ندارند. در مقابل، شرکت‌های بزرگ‌تر که سهم بالایی از بازار را در اختیار دارند، به‌واسطه دسترسی به داده‌های بیشتر، از ظرفیت بالاتری برای توسعه مدل‌های پیشرفته هوش مصنوعی برخوردار هستند.

در سطح حاکمیتی، سامانه‌ای به نام «سنهاب» توسط بیمه مرکزی به‌عنوان پایگاه داده‌ای متمرکز معرفی شده است. بااین‌حال، در عمل این سامانه فاقد جزئیات حیاتی است و نمی‌تواند نیازهای تحلیلی شرکت‌های بیمه را به‌طور کامل پاسخ دهد. اطلاعات دقیق و ارزشمند همچنان در اختیار شرکت‌های بیمه‌ای باقی مانده است و این مسئله، مانعی جدی بر سر راه شکل‌گیری نظام تحلیل داده یکپارچه در صنعت بیمه کشور است.

از سوی دیگر، تجربه‌های قبلی همکاری میان شرکت‌های بیمه و فعالان بیرونی حوزه هوش مصنوعی به نوعی بی‌اعتمادی منجر شده است. شرکت‌های هوش مصنوعی با استفاده از داده‌های در اختیارشان، مدل‌هایی را توسعه داده‌اند که بعدها همان مدل‌ها را با قیمت بالا به شرکت‌های تأمین‌کننده داده پیشنهاد داده‌اند، بدون در نظر گرفتن نقش محوری داده‌های اولیه در تولید آن مدل‌ها. این روند باعث شده است تا بسیاری از شرکت‌های بیمه ترجیح دهند داده‌های خود را به هیچ‌عنوان در اختیار نهادهای بیرونی قرار ندهند.

در پاسخ به این شرایط، رویکرد غالب در میان شرکت‌های بزرگ بیمه‌ای، حرکت به‌سوی خودکفایی در حوزه تحلیل داده و توسعه هوش مصنوعی در درون سازمان است. به‌تدریج این شرکت‌ها در حال ایجاد واحدهای تخصصی هوش مصنوعی هستند تا بدون وابستگی به شرکت‌های بیرونی، از داده‌های خود بهره‌برداری کنند.

چرا صنعت بیمه در برابر تقلب آسیب‌پذیر باقی مانده است؟

در این مسیر، چالش‌های فنی نیز بسیار تعیین‌کننده‌اند. داده‌های بیمه‌ای معمولاً در قالب‌های ناهمگن و در سامانه‌های مختلف مانند Core Insurance Systems، سامانه خسارت، CRM و پورتال‌های نمایندگان ذخیره می‌شوند. برای یکپارچه‌سازی این داده‌ها، نیاز به معماری داده مدرن شامل Data Lake و Data Warehouse ترکیبی وجود دارد تا داده‌ها از طریق APIهای استاندارد و سرویس‌های ETL وارد لایه تحلیلی شوند.

همچنین، مدل‌سازی داده بر اساس استانداردهای بین‌المللی نظیر ACORD می‌تواند به هم‌زبانی داده‌ها میان شرکت‌ها کمک کند. از سوی دیگر، ایجاد Metadata Layer و تعریف Data Catalog امکان ردیابی، کنترل کیفیت و مدیریت منشأ داده‌ها (Data Lineage) را فراهم می‌سازد. در لایه هوش مصنوعی، استفاده از الگوریتم‌های Graph Neural Network برای تشخیص ارتباطات پنهان بین بیمه‌گذاران و شبکه‌های تقلب، و بهره‌گیری از مدل‌های Generative AI برای شبیه‌سازی سناریوهای خسارت، می‌تواند به دقت تحلیل‌ها بیفزاید. در نهایت، بهره‌گیری از زیرساخت‌های ابری بومی و یک Data Governance Framework شفاف، شرط لازم برای مقیاس‌پذیری و اعتمادپذیری در تحلیل‌های داده‌محور صنعت بیمه است.

در جمع‌بندی می‌توان گفت که داده‌ها در صنعت بیمه نه متمرکز هستند و نه زیرساختی برای حاکمیت داده در سطح ملی وجود دارد. بیمه مرکزی نیز تاکنون سند روشنی در این حوزه ارائه نکرده و اقدام اخیر آن در راه‌اندازی یک «آزمایشگاه داده» نیز به‌دلیل محدود بودن داده‌ها و نبود زیرساخت‌های پردازشی مؤثر، پاسخ‌گوی نیاز صنعت نیست. عدم اشتراک‌گذاری داده بین شرکت‌های بیمه، نبود زیرساخت پردازش در سطح ملی و بی‌اعتمادی متقابل میان شرکت‌های بیمه و شرکت‌های هوش مصنوعی، همگی دست‌به‌دست هم داده‌اند تا صنعت بیمه در برابر تقلب آسیب‌پذیر باقی بماند.

در آینده‌ای نه‌چندان دور، بیمه‌ها ناچار خواهند بود همان مسیری را طی کنند که بانک‌ها پیش‌تر طی کرده‌اند: ایجاد واحدهای فناوری اطلاعات و هوش مصنوعی درون‌سازمانی برای استفاده حداکثری از داده‌های خود، بدون اتکا به بازیگران بیرونی.