یکی از مشکلات بزرگ توسعهی پروژههای یادگیری ماشین آن است که دادههای مرتبط کافی برایآموزش الگوریتمها وجود ندارد. گروه Superb AI از اعضای کلاس زمستانی Y Combinator برای حل این مشکل وارد عمل شد. این استارتاپ به شرکتها کمک میکند دادههای شخصیسازیشده برای هر پروژهای در حوزهی یادگیری ماشین ایجاد کنند. برای ایجاد دادههای شخصیسازیشده نیز ازهوش مصنوعی استفاده میشود.
هیون کیم، همبنیانگذار و مدیرعامل استارتاپ مذکور، اعتقاد دارد یکی از مشکلات اصلی شرکتها در اجرای فناوریهای هوش مصنوعی و یادگیری ماشین، جمعآوری مجموعه دادههای مفید برای آموزش مدلها است. او دربارهی هوش مصنوعی شرکت خود میگوید:
Superb AI از هوش مصنوعی استفاده میکند تا دادههای شخصیسازیشده برای آموزش هوش مصنوعی در شرکتهای بزرگ دنیای فناوری تولید کند. مشتریان برای توسعهی قابلیتهای مبتنی بر یادگیری ماشین با ما همکاری میکنند که درنهایت، به توسعهی هرچهسریعتر آنها میانجامد.
کیم بههمراه همبنیانگذاران دیگر شامل جونگ کوون لی، مدیر فناوری و جونگیوک لی و مونسو چا، مهندسان یادگیری ماشین و هیوندونگ لی، مدیر فروش و عملیات، از زمان کشف مشکل دادهها در آموزش سیستمهای یادگیری ماشین در آن حوزه مشغول بودهاند و تصمیم گرفتند شرکتی برای حل آن تأسیس کنند.
شرکتهای فعال در حوزهی یادگیری ماشین، عموما از نیروی انسانی برای برچسبگذاری روی اطلاعات استفاده میکنند. چنین روندی گرانقیمت و احتمال بُروز خطا در آن نیز بسیار است. بهعلاوه، اجرای آن تنها درصورتی امکانپذیر خواهد بود که دادههای مدنظر دراختیار شرکتها باشد که عموما نیست. کیم و دیگر بنیانگذاران استارتاپ مذکور در دوران دانشگاه درزمینهی هوش مصنوعی مطالعه کردهاند. آنها به این نتیجه رسیدند که استفاده از هوش مصنوعی بهترین راهکار برای بهبود برچسبگذاری روی اطلاعات خواهد بود.
کیم میگوید هوش مصنوعی آنها بهجای استفاده از روند پرخطا و آهستهی انسانی، از سیستم اختصاصییادگیری عمیق بهره میبرد که با سرعتی تا ۱۰ برابر بیشتر اطلاعاتی همچون عکس و ویدئو را برچسبگذاری میکند. شرکت آنها علاوهبر روند ذکرشده، به شرکتها کمک میکند مجموعه دادهی موردنیاز خود را تهیه کنند.
مدیرعامل Superb AI میگوید آنها نیروی انسانی را کاملا از فرایند برچسبگذاری حذف نمیکنند؛ بلکه با ترکیب هوش انسانی و مصنوعی، فرایند را تسهیل میبخشند. فعالیت آنها چند مرحله دارد: ابتدا، دادههای آموزشی تاحدممکن تقسیمبندی میشوند تا فرایندها بهصورت مرحلهبهمرحله اتوماتیک شوند. اگر دادهها بیشازحد پیچیده باشند و فرایند برچسبگذاری قابلیت اتوماسیون نداشته باشد، رویکردی دیگر با نام Human in the Loop استفاده میشود. با آن فرایند، وقتی هوش انسانی اطلاعات را برچسبگذاری کند، هوش مصنوعی روند آن را بهمرور میآموزد و کمکم کنترل فرایند را در دست میگیرد.