این روزها با گسترش تکنولوژی، دادههای متنی به سرعت در حال افزایش هستند، به همین دلیل پردازش زبان طبیعی در حال تبدیل شدن به یک ابزار استراتژیک برای تجزیه و تحلیل مالی است.
Mikey Shulman، مدرس امور مالی، سه سال پس از تدریس یادگیری ماشینی در MIT Sloan، تنها یک شکایت دارد: همراهی با رشد این و گسترش این حوزه سخت است. او گفت: «یادگیری ماشینی رشتهای است که به سرعت در حال حرکت رو به جلو است، بسیاری از مواردی که در حال حاضر حرفهای و پیشرفته محسوب میشوند، زمانی که من یک سال پیش این دوره را تدریس کردم، اختراع نشده بودند.»
این دوره که به طور رسمی «تحلیل دادههای پیشرفته و یادگیری ماشینی در امور مالی» نامیده میشود، نشاندهنده جنبشی در امور مالی است که معمولا در حوزه تکنولوژی به عنوان یک صنعت محتاط شناخته میشود. یادگیری ماشینی برای کمک به تصمیمگیریهای سریعتر و بهتر استفاده میشود.
Shulman، رئیس بخش یادگیری ماشینی در Kensho گفت: شرکتهای تجزیه و تحلیل مالی به پردازش زبان طبیعی روی میآورند تا دادههای متنی را صدها هزار بار سریعتر و دقیقتر از آن چه که انسانها میتوانند، تجزیه و تحلیل کنند. (Kensho استارتآپی، که در هوش مصنوعی و تجزیه و تحلیل است که در جوامع مالی و اطلاعاتی آمریکا تخصص دارد، توسط اس. اس. پی. گلوبال در سال ۲۰۱۸ ایجاد شده است.)
یک ناظر معمولی ممکن است فرض کند که دادههای مالی بیشتر عددی هستند تا متنی، اما Shulman چنین اعتقادی ندارد. به گفته او «به ویژه در امور مالی، دادههایی که میتوانند به تصمیمگیری به موقع کمک کنند، به صورت متنی هستند.»
Shulman می گوید که متنها دادههای ساختار یافته نیستند و استفاده از دادههای ساختار نیافتهای که روی آنها پردازش زبان طبیعی وارد انجام میشود، ذاتا سخت است.
یک نوع یادگیری ماشین به نام NLP میتواند پیچیدگیهای صوتی مرتبط با تجارت و امور مالی از جمله اصطلاحات تخصصی صنعتی، اعداد، ارزها و نام محصولات را تجزیه کند.
به عنوان مثال می توان درآمد را در نظر گرفت. به گفته Shulman، یک شرکت صبح گزارش خود را منتشر کرده و میگوید: «درآمد هر سهم ما برابر با ۱۲ / ۱ دلار بود.» این یک نمونه از داده متنی است. زمانی که دادهها به یک دیتابیس ارائه میشوند، شما میتوانید آن را به صورت ساختار یافته دریافت کنید و در این جا برتری خود را از دست میدهید؛ در این وضعیت ساعتها از زمان گذشته است. در حالی که NLP میتواند این نسخهها را در عرض چند دقیقه تحویل داده و یک مزیت رقابتی به تحلیلگران دهد.
۳ مورد استفاده پردازش زبان طبیعی در امور مالی
Georg Kucsko، استاد دانشگاه MIT در امور مالی که در کلاس به همراه Shulman تدریس میکند، میگوید: «پردازش زبان طبیعی در حوزه مالی ممکن است نسبتاً جدید باشد، اما با افزایش سرعت آن، این صنعت میتواند با کمک سالها تحقیق و توسعه انجام شده توسط غولهای فنآوری مانند گوگل و فیس بوک رشد کند.»
آنها ده ها سال است که با زبان کار می کنند. Kucsko، رئیس تحقیق و توسعه یادگیری ماشین در Kensho گفت: ابزارهای غربالگری اطلاعات، که به افراد امکان می دهد توییتهای آزاردهنده را فیلتر کنند یا با کمک گرفتن یک کوئری ساده در اینترنت سرچ کنند، نویدهای قابل توجهی برای امور مالی دارند.
کوسکو گفت: «چه در حال تحقیق بر روی یک شرکت باشید و چه در حال استخراج مجموعهای از دادههای کلان در کشوری که به آن علاقه دارید؛ هیچ انسانی هرگز نمی تواند آنها را بخواند، شما به همان نوع فنآوری نیاز دارید.»
Shulman و Kucsko، سه مورد را مطرح کردند که با کمک آنها NLP میتواند فرایند تصمیمگیری و سرعت را در داخل سازمانهای مالی بهبود بخشد:
-
اتوماسیون (Automation)
NLP میتواند جایگزین فرآیندهای دستی که مؤسسات مالی به کار میبرند تا دادههای بدون ساختار را به شکل قابل استفادهتری تبدیل کند، باشد؛ به عنوان مثال، ضبط خودکار تماسهای منجر به درآمد، عرضههای مدیریتی و اخبارهای مالکیتی.
-
غنی سازی دادهها (Data enrichment)
زمانی که دادههای بدون ساختار ثبت میشوند، اضافه کردن متن به آنها قابلیت جستجو و اجرایی شدن میبخشد. Shulman میگوید: «تصور کنید که من نسخهای از یک تماس را دریافت کنم و بخواهم جاهایی را پیدا کنم که در آنها درباره اثرات زیستمحیطی صحبت میکنند.»
یادگیری ماشین میتواند آن بخشهایی از آن متن خام را که به اثرات زیست محیط، تاثیر مالی، یا سایر موضوعات سودمند میپردازد،با کمک برچسب گذاری متادیتا غنی کند.
-
جستجو و کشف (Search and discovery)
یکی از ماموریتهای امور مالی ایجاد مزیت رقابتی با استفاده انواع گستردهتر و متنوعتر از دادهها است. اما موضوعی که فراموش میشود، تجربه روش جستجویی آسان و مؤثری است که استفادهکنندگان از تب جستجوی Google به آن عادت کردهاند.
Shulman میگوید: «اگر شما در یک بانک یا یک صندوق سرمایهگذاری کار میکنید، جستجو اطلاعات اختصاصی، میتواند برای شما تبدیل به یک کابوس تبدیل شود. یک تحلیلگر ممکن است بخواهد تایپ کند،«به من Obamacare را در پروندههای ۱۰ K نشان دهید»، اما هیچ پرونده ۱۰ K هرگز آن را Obamacare نخواهد نامید. ما به سیستمهایی نیاز داریم که به اندازه کافی باهوش باشند تا بدانند که این سیستم احتمالا PPACA نامیده خواهد شد.»
بیشتر بخوانید: هوش تجاری چیست؟
یادگیری ماشینی برای حجم زیاد دادهها (masses)
برای موسسات مالی که به دستیابی به این مزایا علاقه دارند، موانع ورود به این حوزه به طور قابلتوجهی کمتر از گذشته است. به لطف آن چه که Shulman آن را «دموکراسی در ابزارها» نامیده است. کدهای کامپیوتری کمتر شناخته شدهای در قالبهای ارزانتر و آسانتر برای یادگیری در دسترس همه قرار گرفته است.
Shulman که مانند Kucsko، دکترای خود را از دانشگاه هاروارد و در رشته فیزیک گرفته است، میگوید: «در واقع اجرای NLP پیشرفته و در بالاترین سطح در امور مالی یا هر حوزه دیگری، بدون داشتن مدرک دکترا در یادگیری ماشین، کاملاً امکانپذیر است.»
رقابت بین گوگل و فیس بوک در بازار اکوسیستم یادگیری ماشینی باعث پیشرفت همه حاضران در این حوزه می شود. امروزه غولهای فناوری هزینه زیادی در فریم ورکهای زبان ماشین رقیب مانند: TensorFlow و PyTorch می کنند. رقبا در تلاش برای تسلط بر بازار، هر دو فریمورک را متنباز کردهاند.
Shulman میگوید: «در حال حاضر این فرایند خیلی آسان است که کمی در گوگل جستجو کنید، ۱۰ خط کد پیدا کنید و با استفاده از یادگیری ماشینی نتایج خیلی جالبی میگیرید.»
پیشروها مسیر را هدایت میکنند
این که در یک سازمان چه کسی به عنوان code-grabber سرویسدهی کرده و چه بخشی code-grabber را مدیریت کند. همگی برنامهریزی شده است. Kucsko میگوید: «شرکتها هنوز در تلاش هستند تا موثرترین راهها را برای ورود به حوزه یادگیری ماشین پیدا کرده و این فرصت را از دست ندهند» در طیف مسائل مالی، واقعا یک راهحل منحصر به فرد وجود ندارد.
شرکتها میتوانند به حوزه جدید محصولات یادگیری ماشینی وارد شوند، یک تیم علم داده ایجاد کنند، یا برای شرکتهای بزرگ، تخصصی که به دنبالش هستند را خریداری کنند؛ مانند زمانی که S. P. Global ، کنشو را خرید.
در بسیاری از موارد شرکتها به لطف افزایش علاقه و ابزارهای در دسترس، به احتمال زیاد وارد کردن یادگیری ماشین را از طریق کانالهای متعدد به سازمان خود در نظر خواهند گرفت.
Kucsko میگوید: «شما تقریبا میتوانید یادگیری ماشین را در هر جایی استفاده کنید، چه در مجموعه از دادههای سطح پایین باشد و چه در محصولات سطح بالای مشتری.»
این انگیزه اغلب از سمت افرادی بوجود می آید که متوجه میشوند دادههای ارزشمندی دارند که کمتر از آنها استفاده میشود. این دادهها می تواند شامل مجموعهای از اسناد، دنبالههای زمانی و فهرستی از تصمیمگیری های خرید و فروش باشند. و آنها می گویند: «ما همه این داده ها را داریم، اما حجم آن ها بزرگتر از آن است که توسط یک فرد پردازش شوند. چگونه میتوانیم از یادگیری ماشینی و پردازش زبان طبیعی برای انجام این کار استفاده کنیم؟»
برای موسسات مالی که ممکن است تمایلی به استقرار تکنیکهای پیشرفته مانند یادگیری ماشینی نداشته باشند، این فرآیند اجتماعی شدن یک گام مهم است. شولمن میگوید: «از آنجایی که افراد بیشتر و بیشتری کارآمدی آن را میبینند و زبان آن را درک میکنند، میبینند که این شعبده نیست بلکه ریاضی است. شما افراد بیشتر و بیشتری را با خود همراه میکنید و از اینکه بخشی از این فرایند هستید، هیجانزده میشوید.»
جمعبندی:
امروزه پردازش زبان طبیعی به عنوان ابزاری سودمند و قدرتمند برای تحلیل اطلاعات کاربران بورسی و حتی اخبار بورسی استفاده میشود. شرکتهای بزرگ از بهروزترین منابع و مقالات علمی برای پیشبرد اهداف بورسی خود استفاده میکنند تا بتوانند مشتریان خود را حفظ کنند و یکی از این تکنولوژیها، پردازش متنهای موجود در اخبار بورسی و اقتصادی و دیگری تحلیل این اخبار در جهت افزایش دقت پیشبینیهای بازار مالی است. امروزه این صنعت به شیوهای پیشرفت کرده است که نه تنها این امر را میسر میکند، بلکه در جهت سود حداکثری سهامداران بورسی هم قدم برمیدارد.
دیدگاهتان را بنویسید