شرکت ارائهدهنده هوش مصنوعی Appen طی گزارشی تشریح کرد که با وجود رشد بهکارگیری فناوری هوش مصنوعی در بخش تجاری و سایر حوزهها، شرکتها در دسترسی به دادههای باکیفیت مورد نیاز برای سیستمهای هوش مصنوعی با مشکل مواجه هستند.
گزارش شرکت Appen درباره وضعیت هوش مصنوعی ۲۰۲۴
شرکتها برای رشد هوش مصنوعی نیازمند دادههای باکیفیت هستند
Venture Beat , 16 آبان 1403 ساعت 13:05
شرکت ارائهدهنده هوش مصنوعی Appen طی گزارشی تشریح کرد که با وجود رشد بهکارگیری فناوری هوش مصنوعی در بخش تجاری و سایر حوزهها، شرکتها در دسترسی به دادههای باکیفیت مورد نیاز برای سیستمهای هوش مصنوعی با مشکل مواجه هستند.
شرکت ارائهدهنده هوش مصنوعی Appen طی گزارشی تشریح کرد که با وجود رشد بهکارگیری فناوری هوش مصنوعی در بخش تجاری و سایر حوزهها، شرکتها در دسترسی به دادههای باکیفیت مورد نیاز برای سیستمهای هوش مصنوعی با مشکل مواجه هستند.
به گزارش افتانا، شرکت Appen در گزارش نظرسنجی با موضوع وضعیت هوش مصنوعی ۲۰۲۴ اعلام کرد که استفاده از این فناوری در یک سال گذشته ۱۷ درصد بیشتر شده است، اما سازمانها با موانع بزرگی برای آمادهسازی داده و تضمین کیفیت آن روبرو هستند. این گزارش نشان از یک رشد ۱۰ درصدی در موانع مربوط به تامین منبع، پاکسازی و نشانهگذاری داده دارد که به پیچیدگیهای ساخت و نگهداری از ابزارهای مفید هوش مصنوعی اشاره میکند.
سی چن، رئیس استراتژی Appen، در این مورد توضیح داد: در حالی که مدلهای هوش مصنوعی با مسائل پیچیده و تخصصیتری دستوپنجه نرم میکنند، پیشنیازهای داده نیز دچار تغییر میشوند. شرکتها به این نتیجه رسیدهاند که داشتن دادههای بیشتر به تنهایی کافی نیست و برای تقویت یک مدل، باید دادهها بسیار باکیفیت باشند و این به معنای دقت، تنوع، نشانگذاری درست و تنظیم آن برای کاربردهای ویژه هوش مصنوعی است.
در شرایطی که شاهد رشد فناوری هوش مصنوعی و بهکارگیری آن در جهان هستیم، این گزارش مواردی را از موانع پیش پای شرکتها شناسایی کرده است که در ادامه به برخی از آنها اشاره میکنیم.
استفاده روزافزون از هوش مصنوعی و افزایش چالشهای داده
با پیشرفت مدلهای بزرگ زبانی که امکان خودکارسازی وظایف مختلف را برای سازمانها و کسبوکارها فراهم میکنند، استفاده از هوش مصنوعی با رشد ۱۷ درصدی در سال ۲۰۲۴ همراه شده است. شرکتها در حوزههای مختلفی از عملیاتهای آیتی گرفته تا تحقیق و توسعه از هوش مصنوعی مولد برای تسهیل فرایندهای داخلی و بهبود بهرهوری استفاده میکنند. اما افزایش استفاده از هوش مصنوعی مولد، باعث ایجاد موانع تازهای مخصوصا در مدیریت داده شده است. چن میگوید: خروجیهای هوش مصنوعی مولد متنوعتر، غیرقابل پیشبنی و وابسته به تحلیل هستند که تعریف و سنجش موفقیت آن را سختتر می کند. مدلها برای رسیدن به سطح آمادگی لازم برای استفاده شرکتی باید با دادههای با کیفیت و مناسب برای کاربردهای خاص تقویت شوند.
یکی از روشهای اصلی تامین دادههای آموزشی، جمعآوری داده شخصیسازی شده است که نشان از تغییر رویکرد پیشین نسبت به جمعآوری دادههای عمومی دارد و در حال حاضر بیشتر شرکتها به سراغ این شگرد میروند.
کاهش استفاده نهایی از هوش مصنوعی شرکتی و ROI
با وجود اشتیاق بیسابقه درمورد هوش مصنوعی، این گزارش از یک جریان نگرانکننده حکایت میکند: پروژههای هوش مصنوعی که به استفاده نهایی میرسند تعداد کمی دارند و حتی آنهایی که به مرحله استفاده نهایی میرسند هم بازده سرمایهگذاری یا ROI پایینی دارند. از سال ۲۰۲۱× میانگین پروژههایی که به مرحله استفاده نهایی رسیدهاند با نرخ ۸.۱ درصد کاهش یافته و در عین حال نرخ پروژههایی که در مرحله اجرا بازده سرمایه معناداری دارند هم ۹.۴ درصد کمتر شده است.
این سقوط ناشی از افزایش پیچیدگی مدلهای هوش مصنوعی است. کاربردهای ساده مثل تشخیص تصویر و خودکارسازی گفتار در حال حاضر به بلوغ رسیدهاند اما شرکتها به سمت طرحهای بلندپروازانهتری مثل هوش مصنوعی مولد میورند که نیازمند دادههای با کیفیت و شخصی سازی شده است و اجرای آنها دشوارتر از نمونههای ساده است.
چن میگوید: «هوش مصنوعی مولد در درک، استدلال و تولید محتوا قابلیتهای پیشرفتهتری دارد اما اجرایی کردن این فناوریها ذاتا دشوار است.»
کاهش کیفیت دادهها با وجود اهمیت روزافزون آن
یک مشکل اساسی برای استفاده از هوش مصنوعی که در این گزارش به آن پرداخته شده این است که دقت داده از سال ۲۰۲۱حدود ۹ درصد کاهش یافته است. در حالی که مدلهای هوش مصنوعی پیچیدهتر میشوند، داده مورد نیاز آنها نیز پیچیدهتر میشود و نیازمند تفسیرهای تخصصی و باکیفیتتر است. ۸۶ درصد شرکتها هر سهماه، هوش مصنوعی خود را احیا یا بهروزرسانی میکنند که این به لزوم دادههای مرتبط و تازه اشاره دارد. با این حال، افزایش نرخ بهروزرسانیها باعث شده تا تضمین دقت و تنوع دادهها سختتر شود. شرکتها برای تامین تقاضای خود به سراغ ارائهدهندگان شخص ثالث داده میروند و حدود ۹۰ درصد از کسبوکارها برای آموزش و ارزیابی مدلهای خود، وابسته به منابع خارجی هستند.
چن در این مورد میگوید: با اینکه نمیتوان آینده را پیشبینی کرد، اما تحقیقات ما نشان میدهد که مدیریت کیفیت داده به مشکل بزرگی برای شرکتها تبدیل خواهدشد. با توجه به پیچیدگی بیشتر مدلهای هوش مصنوعی مولد، تامین، پاکسازی و نشانهگذاری داده حتی همین امروز هم به یک مانع کلیدی تبدیل شده است.
افزایش چالش تامین و آمادهسازی دادههای خاص
این گزارش بیان میکند که بنبست و تنگناهای مربوط به تامین، پاکسازی و نشانگذاری داده با نرخ ۱۰ درصد در سال در حال افزایش است. این تنگناها و بنبستها به طور مستقیم بر اجرای موفق پروژههای هوش مصنوعی تاثیرگذارند. هرچه کاربردهای هوش مصنوعی تخصصیتر میشود، چالش تامین و آمادهسازی دادههای خاص نیز سختتر می شود. چن میگوید: مشکلات آمادهسازی داده افزایش یافته است. ماهیت تخصصی این مدلها باعث الزام دیتاستهای تخصصی شده است.
شرکتها برای رفع این مشکلات به استراتژیهای بلندمدتی روی آوردهاند که بر دقت، پایداری و تنوع داده تاکید دارد. بسیاری از شرکتها نیز به دنبال همکاری استراتژی با ارائهدهندگان داده هستند.
و انسانها همچنان بازیگران مهمی هستند
با وجود پیشرفت فزاینده هوش مصنوعی، نقش انسانها بیش از پیش افزایش یافته است. این گزارش نشان میدهد که ۸۰ درصد از پاسخدهندگان به نظرسنجی در اهمیت حضور انسان در حلقه یادگیری ماشینی تردیدی ندارند. براساس این فرایند، از انسانها برای راهنمایی و بهبود مدلهای هوش مصنوعی استفاده میشود. به گفته چن، مداخله انسانی همچنان برای توسعه سیستمهای هوش مصنوعی با بازدهی بالا و اخلاقی و مرتبط، نقش اساسی دارد.
حضور متخصصان انسانی بهویژه در جلوگیری از جهتگیریها و رعایت موضوعات اخلاقی دارای اهمیت است. انسانها با دانش خاص و شناسایی سوگیریهای موجود در خروجی هوش مصنوعی به اصلاح و همسویی مدلها با رفتار و ارزشهای جهان واقعی کمک میکنند. این مسئله مخصوصا در مورد هوش مصنوعی مولد که خروجی آن غیرقابل پیشبینی است و به نظارت نیاز دارد دارای اهمیت فراوانی است.
کد مطلب: 22548