یکی از بزرگترین چالشهای دادهای در صنعت بیمه، نبود یک ساختار پیوسته و متمرکز برای نگهداری تاریخچه بیمهنامههاست. با تغییر شرکت بیمه از سوی مشتریان، بخش مهمی از سوابق و اطلاعات آنها از دست میرود. این گسست اطلاعاتی نهتنها امکان تحلیل دقیق دادهها را کاهش میدهد، بلکه تشخیص تقلب را نیز با دشواری جدی مواجه میکند؛ چراکه زنجیره اطلاعات بهصورت کامل در دسترس هیچیک از شرکتها نیست.
در این میان، شکاف اطلاعاتی میان شرکتهای بیمه کوچک و بزرگ نیز وضعیت را پیچیدهتر میکند. شرکتهای کوچک بهدلیل حجم محدود داده، امکان بهرهبرداری مؤثر از تحلیلهای مبتنی بر هوش مصنوعی را ندارند. در مقابل، شرکتهای بزرگتر که سهم بالایی از بازار را در اختیار دارند، بهواسطه دسترسی به دادههای بیشتر، از ظرفیت بالاتری برای توسعه مدلهای پیشرفته هوش مصنوعی برخوردار هستند.
در سطح حاکمیتی، سامانهای به نام «سنهاب» توسط بیمه مرکزی بهعنوان پایگاه دادهای متمرکز معرفی شده است. بااینحال، در عمل این سامانه فاقد جزئیات حیاتی است و نمیتواند نیازهای تحلیلی شرکتهای بیمه را بهطور کامل پاسخ دهد. اطلاعات دقیق و ارزشمند همچنان در اختیار شرکتهای بیمهای باقی مانده است و این مسئله، مانعی جدی بر سر راه شکلگیری نظام تحلیل داده یکپارچه در صنعت بیمه کشور است.
از سوی دیگر، تجربههای قبلی همکاری میان شرکتهای بیمه و فعالان بیرونی حوزه هوش مصنوعی به نوعی بیاعتمادی منجر شده است. شرکتهای هوش مصنوعی با استفاده از دادههای در اختیارشان، مدلهایی را توسعه دادهاند که بعدها همان مدلها را با قیمت بالا به شرکتهای تأمینکننده داده پیشنهاد دادهاند، بدون در نظر گرفتن نقش محوری دادههای اولیه در تولید آن مدلها. این روند باعث شده است تا بسیاری از شرکتهای بیمه ترجیح دهند دادههای خود را به هیچعنوان در اختیار نهادهای بیرونی قرار ندهند.
در پاسخ به این شرایط، رویکرد غالب در میان شرکتهای بزرگ بیمهای، حرکت بهسوی خودکفایی در حوزه تحلیل داده و توسعه هوش مصنوعی در درون سازمان است. بهتدریج این شرکتها در حال ایجاد واحدهای تخصصی هوش مصنوعی هستند تا بدون وابستگی به شرکتهای بیرونی، از دادههای خود بهرهبرداری کنند.
چرا صنعت بیمه در برابر تقلب آسیبپذیر باقی مانده است؟
در این مسیر، چالشهای فنی نیز بسیار تعیینکنندهاند. دادههای بیمهای معمولاً در قالبهای ناهمگن و در سامانههای مختلف مانند Core Insurance Systems، سامانه خسارت، CRM و پورتالهای نمایندگان ذخیره میشوند. برای یکپارچهسازی این دادهها، نیاز به معماری داده مدرن شامل Data Lake و Data Warehouse ترکیبی وجود دارد تا دادهها از طریق APIهای استاندارد و سرویسهای ETL وارد لایه تحلیلی شوند.
همچنین، مدلسازی داده بر اساس استانداردهای بینالمللی نظیر ACORD میتواند به همزبانی دادهها میان شرکتها کمک کند. از سوی دیگر، ایجاد Metadata Layer و تعریف Data Catalog امکان ردیابی، کنترل کیفیت و مدیریت منشأ دادهها (Data Lineage) را فراهم میسازد. در لایه هوش مصنوعی، استفاده از الگوریتمهای Graph Neural Network برای تشخیص ارتباطات پنهان بین بیمهگذاران و شبکههای تقلب، و بهرهگیری از مدلهای Generative AI برای شبیهسازی سناریوهای خسارت، میتواند به دقت تحلیلها بیفزاید. در نهایت، بهرهگیری از زیرساختهای ابری بومی و یک Data Governance Framework شفاف، شرط لازم برای مقیاسپذیری و اعتمادپذیری در تحلیلهای دادهمحور صنعت بیمه است.
در جمعبندی میتوان گفت که دادهها در صنعت بیمه نه متمرکز هستند و نه زیرساختی برای حاکمیت داده در سطح ملی وجود دارد. بیمه مرکزی نیز تاکنون سند روشنی در این حوزه ارائه نکرده و اقدام اخیر آن در راهاندازی یک «آزمایشگاه داده» نیز بهدلیل محدود بودن دادهها و نبود زیرساختهای پردازشی مؤثر، پاسخگوی نیاز صنعت نیست. عدم اشتراکگذاری داده بین شرکتهای بیمه، نبود زیرساخت پردازش در سطح ملی و بیاعتمادی متقابل میان شرکتهای بیمه و شرکتهای هوش مصنوعی، همگی دستبهدست هم دادهاند تا صنعت بیمه در برابر تقلب آسیبپذیر باقی بماند.
در آیندهای نهچندان دور، بیمهها ناچار خواهند بود همان مسیری را طی کنند که بانکها پیشتر طی کردهاند: ایجاد واحدهای فناوری اطلاعات و هوش مصنوعی درونسازمانی برای استفاده حداکثری از دادههای خود، بدون اتکا به بازیگران بیرونی.