بلومبرگ به تازگی مقالهای را منتشر کرده است که نشان میدهد از تکنیکهای هوش مصنوعی که GPT برای مجموعه دادههای مالی خود استفاده میکند، استقبال کرده است. بلومبرگ بیش از ۴۰ سال است که به عنوان یک مرجع مورد اعتماد دادههای بازار مالی در صنایع تجاری و مالی، شناخته میشود.
به همین دلیل، بلومبرگ تعداد قابل توجهی پایگاه داده انحصاری و با دقت مدیریت شده را جمع آوری کرده است. این دادهها، از بسیاری جهات، مهمترین اطلاعات بلومبرگ هستند که در این نسخه از BloombergGPT، برای ایجاد یک ابزار مطالعه و تحلیل مالی کاملاً جدید استفاده میشود.فرآیند “آموزش” الگوریتم های یادگیری ماشینی شامل یادگیری از داده های خام و ایجاد یک مدل است. تقریباً ۵۳ روز طول کشید تا آموزش مدل BloombergGPT بر روی ۶۴ رایانه تکمیل شود که هر کدام شامل ۸ پردازنده گرافیکی NVIDIANVDA -2.1%DIA +0.3% 40GB A100 بود.
به عنوان یک مرجع، هنگام استفاده از چت جی پی تی (ChatGPT)، به یک مدل (یا فرمول) ورودی میدهیم که به آن prompt گفته میشود، و سپس مدل یک خروجی تولید میکند. این مدلها باید با استفاده از مقادیر عظیمی از قدرت محاسباتی تولید شوند، بنابراین بلومبرگ با NVIDIA و خدمات وب آمازون برای ایجاد مدل BloombergGPT همکاری کرد.
تیم BloombergGPT استفاده از سرویسهای ابری AWS را برای انجام محاسبات انتخاب کردند، زیرا هر GPU زمانی که تازه خریداری میشود گران است و فقط برای مدت کوتاهی برای تولید مدل استفاده میشود. ما میتوانیم هزینه تقریبی بیش از ۲.۷ میلیون دلار را برای تولید این مدل به تنهایی تخمین بزنیم زیرا قیمت هر نمونه سرور ۳۳ دلار در ساعت است.
ربات BloombergGPT منبع داده مالی خود را با استفاده از مدل Unigram به ۳۶۳ میلیارد توکن تقسیم میکند که کارایی و مزایای خاصی را ارائه میدهد.
گفتنی است تیم بلومبرگ از PyTorch، یک بسته یادگیری عمیق رایگان و منبع باز محبوب مبتنی بر پایتون، برای آموزش مدل BloombergGPT استفاده کرد.
در مورد BloombergGPT، مجموعه دادههای منبع شامل درصدهای اخبار مالی، پروندههای مالی شرکتها، بیانیههای مطبوعاتی و مطالب Bloomberg News است که همه آنها طی چندین سال توسط بلومبرگ جمعآوری شدهاند. ترکیب این دادهها توسط این ربات، میتواند یک روش کاملاً جدید برای انجام مطالعات مالی ارائه دهد.
جمعآوری دادههای مالی که بلومبرگ برای آموزش استفاده میکند، FINPILE نامیده میشود و بازه زمانی از ۱ مارس ۲۰۰۷ تا ۳۱ ژوئیه ۲۰۲۲ را پوشش میدهد.
منابع اصلی اطلاعات معاملاتی FINPILE به پنج دسته تقسیم میشوند:
۱. وب مالی: مانند وب سایت ها و اسناد محدود به وب سایتهای خاصی است که در دسته مالی قرار میگیرند. حتی در این زمینه، BloomberGPT فقط سایتهایی را که قابل اعتماد و با بالاترین کالیبر میداند را بررسی میکند.
۲. اخبار مالی: حتی اگر وب سایتهای مالی را بررسی میکند، وب سایتهای خبری که اطلاعات خبری تولید میکنند نیاز به توجه خاصی دارند. در حالی که دسته بندیهای مختلف محتوای زیادی در وب وجود دارد، از جمله فایل های PDF و تصاویر، سایت های خبری نیاز به نظارت دقیق تری دارند.
۳. پروندههای شرکتی: هر کسی که در مورد یک تجارت عمومی تحقیق می کند باید به بررسی پرونده های آن فکر کند. در ایالات متحده، مخزن مورد استفاده برای مرور و بازیابی پرونده ها معمولاً پایگاه داده EDGAR SEC است.
۴. بیانیه های مطبوعاتی: اطلاعات مالی اغلب در ارتباطات عمومی رسمی یک شرکت گنجانده می شود، به همین دلیل است که BloombergGPT آن را به عنوان منبع فهرست کرده است.
۵. اخبار بلومبرگ: از آنجایی که بلومبرگ یک سازمان رسانه ای نیز هست، BloombergGPT از اطلاعات خبری خود نیز استفاده میکند.
گروه های مالی و هوش مصنوعی با معرفی BloombergGPT پیشرفت زیادی کرده اند. این مدل در حال حاضر برای عموم قابل دسترسی نیست و نه API و نه رابط چت وجود دارد. مشخص نیست که آیا دسترسی عمومی ارائه خواهد شد یا نه. تیم BloombergGPT در مقاله خود بیان کرده است که آنها این مدل را در اختیار عموم مردم قرار نمیدهند.
نکته: این مطلب خبری هیچگونه پیشنهاد خرید، فروش یا سرمایهگذاری نیست و صرفا جهت آشنا شدن شما کاربران عزیز با اخبار ارزهای دیجیتال ارائه شده است و ارزتودی در قبال آن مسئولیتی ندارد.