شرکت چینی DeepSeek در ۲۰ ژانویه با عرضه مدلهای زبانی چندوجهی (LLMs) خود به نامهای DeepSeek-R1 و DeepSeek-R1-Zero، جهان را شگفتزده کرد. این مدلها عملکردی مشابه با مدل o1 شرکت OpenAI ارائه میدهند و از معماری باز با مجموع ۶۷۱ میلیارد پارامتر بهره میبرند. DeepSeek که تنها توسط صندوق سرمایهگذاری چینی High-Flyer تأمین مالی شده و توسط لیانگ ونفنگ در هانگژو تأسیس شده، به سرعت به یکی از بازیگران اصلی در تحقیقات هوش مصنوعی تبدیل شده است.
DeepSeek V3 که در دسامبر ۲۰۲۴ منتشر شد، یک مدل زبانی “استاندارد” مشابه GPT-4 شرکت OpenAI بود. در مقابل، R1 که اخیراً عرضه شده، یک مدل استدلالی است که با o1 شرکت OpenAI قابل مقایسه است. چین به طور پیوسته در تحقیقات هوش مصنوعی پیشرفت کرده و مدلهای با کیفیت بالایی مانند خانواده Qwen که توسط علیبابا توسعه یافته، تولید کرده است. رقابت شدید در چین منجر به جنگ قیمتها شده که هزینه میزبانی LLM را به طور قابل توجهی کاهش داده و نوآوری سریع را تقویت کرده است.
پیامدهای ژئوپلیتیکی و فناوری
حداقل دو عامل ژئوپلیتیکی مهم باعث تسریع نوآوری هوش مصنوعی در چین شده است:
۱. دسترسی محدود به مدلهای هوش مصنوعی غربی: از ژانویه ۲۰۲۵، مدلهای GPT شرکت OpenAI و مدلهای Llama شرکت Meta یا مسدود شدهاند یا به طور رسمی در چین در دسترس نیستند.
۲. محدودیتهای سختافزاری: محدودیتهای صادراتی آمریکا، دسترسی به پردازندههای گرافیکی Nvidia را در چین محدود کرده است. با این حال، گزارش شده که DeepSeek مدل V3 خود را با تنها ۵٪ از GPUهایی که OpenAI استفاده کرده، آموزش داده است.
مدلهای باز در مقابل مدلهای بسته: تمایزی مهم برای متخصصان بیمه
یان لوکان، دانشمند ارشد هوش مصنوعی Meta، اخیراً در توییتر نوشت: “برای کسانی که فکر میکنند چین در هوش مصنوعی از آمریکا پیشی گرفته، تفکر صحیح این است که مدلهای متنباز از مدلهای بسته پیشی میگیرند.”
مدلهای بسته
مدلهای LLM بسته مانند GPT شرکت OpenAI، Gemini گوگل، Claude شرکت Anthropic و Titan شرکت AWS، دادههای آموزشی، معماری و وزنهای خود را مخفی نگه میدارند و تنها از طریق APIها قابل دسترسی هستند.
مدلهای باز
مدلهای متنباز شامل Llama شرکت Meta، Mistral و محصولات DeepSeek، دسترسی به وزنهای آموزشدیده را فراهم میکنند و شرکتها میتوانند مدلها را روی زیرساخت خود مستقر و تنظیم کنند.
کاربردها در بیمه عمر: تنظیم دقیق برای کارایی هزینه
برای بیمهگران عمر، استخراج بینش از دادههای پزشکی ساختارنیافته یک چالش مهم است. مدلهای باز میتوانند برای موارد زیر استفاده شوند:
- تحلیل اسناد پزشکی
- تشخیص تقلب
- خودکارسازی خدمات مشتری
بهترین شیوههای حفظ حریم خصوصی دادهها
۱. استقرار مدلها به صورت داخلی یا روی زیرساختهای ابری مورد اعتماد ۲. بررسی توافقنامههای حقوقی برای استفاده از API ۳. پیادهسازی کنترلهای دسترسی و ممیزی
آینده هوش مصنوعی باز در صنعت بیمه
ظهور مدلهای هوش مصنوعی باز فرصتی تحولآفرین برای بیمهگران عمر ایجاد کرده است. با پذیرش LLMهای متنباز، بیمهگران میتوانند هزینهها را کاهش داده، دقت را افزایش دهند و کنترل دادههای حساس را حفظ کنند. پیشرفتهای DeepSeek نشان میدهد که هوش مصنوعی پیشرفته دیگر محدود به اکوسیستمهای بسته نیست و نوآوری باز به سرعت در حال ایجاد تعادل در این عرصه است.