این روزها علم داده یا Data Science یکی از موضوعات بسیار جذاب دنیای IT به شمار میرود؛ دانشی برای یک مسیر شغلی جدید که افراد زیادی داوطلب یادگیری آن هستند. دادهپردازان حرفهای به این نتیجه رسیدهاند که مهارتهای سنتی استفاده از کلان داده (Big Data)، آنالیز، تحلیل دادهها و مهارتهای برنامهنویسی آنها نیازمند بهروزرسانی و بهبود است. دانشمندان علم داده برای استفاده هوشمندانه از اطلاعات در سازمان خود، باید بر طیف کاملی از چرخه حیات علم داده تسلط داشته و دارای سطح انعطافپذیری و درک بالاتری برای بررسی بازدهی هر مرحله از فرآیند باشند. در این مقاله درباره دیتاساینس و تاریخچه آن صحبت میکنیم و موقعیتهای شغلی موجود در این زمینه را به شما معرفی خواهیم کرد.
تاریخچه دیتا ساینس
استفاده از اصطلاح دانشمند داده یا دیتا ساینتیست (Data Scientist) از سال ۲۰۰۸ رواج پیدا کرد. سازمانها پس از گسترش سریع دانش و افزایش قابل توجه دادهها به این نتیجه رسیدند که برای سازماندهی، تجزیه و تحلیل و کسب نتیجه کاربردی، نیاز به متخصصانی دارند که بتوانند دادههایی با حجم زیاد را پردازش کنند و از میان انبوه اطلاعاتی که ممکن است در نگاه اول حتی کاربردی به نظر نرسند، نتایج مورد انتظار سازمان را استخراج کنند.
در سال ۲۰۰۹ هال واریان (Hal Varian)، اقتصاددان ارشد گوگل و استاد دانشگاه برکلی در زمینههای علوم اطلاعات، تجارت و اقتصاد، مقالهای در McKinsey & Company به چاپ رساند و در آن به اهمیت سازگاری با تأثیرات فناوری اشاره و تغییر شکل مجدد صنایع مختلف را پیشبینی کرده بود:
«توانایی به دست آوردن داده، پردازش آن، ایجاد ارزش از داده و قابلیت تجسم بخشیدن به آن برای ایجاد معنا، مهارت بسیار مهمی در دهههای آینده خواهد بود.»
کاربردهای علم داده (Data Science)
علم داده در صنایع و حوزههای مختلف کاربردهای گستردهای دارد و به کسب و کارها و سازمانها، در تحلیل دادهها و تصمیمگیری آگاهانه کمک میکند. در ادامه، به چند مورد از این کاربردها اشاره میکنیم:
۱. پیشبینی رفتار مشتری
با استفاده از تحلیل دادههای گذشته و رفتار مشتریان، سازمانها میتوانند روند خرید، علایق و نیازهای مشتریان را پیشبینی کنند و خدمات بهتری به آنها ارائه دهند.
۲. بهینهسازی زنجیره تامین
علم داده با شناسایی الگوهای رایج تامین، میتواند جریان تامین و توزیع کالاها را بهویژه در صنایعی مانند خردهفروشی و تولید بهینه کند و هزینهها را کاهش دهد.
۳. شناسایی تقلب
الگوریتمهای یادگیری ماشین برای شناسایی الگوهای غیرعادی در دادههای مالی و جلوگیری از تقلب در تراکنشها استفاده میشوند.
۴. بهبود سلامت عمومی
از علم داده برای تحلیل سوابق پزشکی، پیشبینی بیماریها و شخصیسازی درمانها استفاده میشود که تاثیر مثبتی بر سلامت بیماران دارد.
۵. بهینهسازی بازاریابی
یکی از موقعیتهای شغلی نسبتا حدید و محبوب بازار، تحلیلگر بازاریابی یا Marketing data analyst است. بازاریابان میتوانند با تحلیل دادهها، کمپینهای تبلیغاتی هدفمندتری طراحی کنند و جذب کاربر و نرخ تبدیل را افزایش دهند.
۶. تجزیهوتحلیل ریسک
در صنایع مالی و بیمه، علم داده برای ارزیابی و کاهش ریسکهای احتمالی استفاده میشود. تشخیص و پیشگیری از تقلب، شناسایی الگوهای غیرمعمول و تحلیل دادههای عظیم هم از کاربردهای دیتاساینس در صنعت بیمه و مالی هستند.
۷. تحلیل شبکههای اجتماعی
بررسی دادههای شبکههای اجتماعی به کمک علم داده، به شناسایی روندها، احساسات کاربران و بهبود استراتژیهای کسبوکار کمک میکند.
مفاهیم کلیدی در علم داده
علم داده شامل اجزا و مفاهیم مختلفی است که هر کدام نقشی کلیدی در تحلیل دادهها و استخراج اطلاعات با ارزش از آنها ایفا میکنند. این مفاهیم عبارتاند از:
جمعآوری دادهها (Data Collection):
دادهها از منابع مختلف مانند پایگاههای داده یا وبسایتها جمعآوری میشوند تا مواد اولیه تحلیل فراهم گردد.
پیشپردازش دادهها (Data Preprocessing):
دادهها تمیز، کامل و آماده استفاده در مدلهای تحلیلی یا یادگیری ماشین میشوند.
تحلیل دادهها (Data Analysis):
با استفاده از روشهای ریاضی و آماری، الگوها و روابط بین دادهها شناسایی میشود.
مدلسازی (Modeling):
مدلهای مختلفی برای پیشبینی و تشخیص الگو از دادههای پیشپردازش شده، ایجاد و اجرا میشوند.
تصویرسازی دادهها (Data Visualization):
نتایج تحلیلها به صورت نمودار و گراف نمایش داده میشود تا فرایند تصمیمگیری برای کسب و کار، دادهمحور و آسانتر شود.
کار یک دانشمند داده چیست؟
در طول دهه گذشته و با سپری شدن زمان، دیتاساینتیستها تبدیل به یکی از اجزاء ضروری برای هر سازمانی شدهاند. این افراد در گردآوری اطلاعات و پردازش داده خبره هستند و دانش فنی بسیار خوبی دارند. آنها با استفاده از الگوریتمهای پیچیده و دانش بالا، مقادیر زیادی از اطلاعات را پردازش و سازماندهی میکنند. سپس با استفاده از این عملیات پاسخهای مورد نیاز سازمان را پیدا میکنند و در اجرای استراتژیهای سازمان، نقش موثری خواهند داشت.
یک دیتا ساینتیست حرفهای میتواند سوالات درستی مطرح کند و به آنها پاسخ دهد. او دادهها را از منابع مختلف جمعآوری و سازماندهی میکند و سپس نتایج را به راه حل تبدیل خواهد کرد. همچنین او یافتههای خود را به روشی منتقل میکند که بر تصمیمات تجاری، تأثیر مثبت بگذارد.
ویژگیهای یک دانشمند داده چیست؟
یک دانشمند داده باید:
- کنجکاو و نتیجهگرا باشد.
- دانش و مهارتهای ارتباطی متناسب با صنعت مربوطه را داشته باشد.
- با داشتن این ویژگیها، بتواند نتایج فنی و تخصصی را برای همکاران خود توضیح دهد.
- دانشی قوی در زمینه آمار و جبر خطی و همچنین برنامهنویسی داشته باشد.
چرا دیتاساینیتست شویم؟
Glassdoor که یکی از معتبرترین سایتهای کاریابی در سراسر اروپا،کانادا و آمریکا است، دیتاساینتیست را برای سومین سال متوالی به عنوان بهترین شغل در آمریکا در سال ۲۰۱۸ انتخاب کرده بود. با دسترسی بیشتر به دادهها، شرکتهای بزرگ فناوری دیگر تنها گروهی نیستند که به دانشمندان داده احتیاج دارند.
تقاضای فزایندهای برای جایگاه شغلی متخصصان علوم داده در صنایع کوچک و بزرگ دیده میشود. کمبود نیروی متخصص در این حوزه هم یک چالش برای سازمانها به شمار میرود.
دیتاساینتیست به عنوان یکی از مورد نیازترین مشاغل در سال ۲۰۱۷ و ۲۰۱۸ معرفی شده است. از این عنوان شغلی به همراه مهارتهای متعدد مرتبط با علوم داده، به عنوان یکی از بیشترین درخواستهای شرکتها نام برده شده است.
موقعیتهای شغلی در حوزه دیتا ساینس
دادهها گسترده هستند و در همه جا دیده میشوند. تعاریف شغلی و موقعیتهای کاری متنوعی در رابطه با استخراج، نظمدهی، تجزیه و تحلیل و تفسیر دادهها وجود دارد که اغلب به جای یکدیگر استفاده میشوند. در ادامه به بررسی تعدادی از اصطلاحات مورد استفاده در این حوزه میپردازیم:
دانشمند داده (Data Scientist)
یک دانشمند داده بررسی میکند که به کدام یک از سوالات باید پاسخ داده شود و از کجا میتوان دادههای مربوطه را پیدا کرد. او باید مهارتهایی مانند تجزیه و تحلیل، استخراج ، جداسازی و ارائه اطلاعات برخوردار باشد.
سازمانها از دانشمندان داده برای تهیه، مدیریت و تجزیه و تحلیل مقدار زیادی از دادههای غیر ساختاری بهره میبرند. این نتایج برای تصمیمگیری استراتژیک در سازمان استفاده میشود.
مهارتهای مورد نیاز برای یک دانشمند داده یا دیتا ساینتیست شامل موارد زیر است:
- مهارتهای برنامهنویسی (SAS, R, Python)
- مهارتهای آماری و ریاضی
- مهارتهای کلامی و تجسم دادهها
- Hadoop
- SQL
- یادگیری ماشین (Machine Learning)
تحلیلگر داده (Data Analyst)
تحلیلگران داده، فاصله بین تحلیلگران تجارت و منطق موجود در دادهها را برطرف میکنند. سوالاتی که در سازمان نیاز به پاسخ دارد، به آنها ارجاع داده میشود. تحلیلگران، دادهها را سازماندهی و تجزیه و تحلیل میکنند تا نتایجی را پیدا کنند که با استراتژیها و نیازهای کسب و کار همسو باشد. تحلیلگران داده وظیفه دارند تجزیه و تحلیلهای تخصصی خود را به صورت اقدامات کیفی و قابل اجرا بیان کنند و یافتهها را به سازمان ارائه دهند.
مهارتهای مورد نیاز برای یک تحلیلگر داده شامل موارد زیر است:
- مهارتهای برنامهنویسی (SAS, R, Python)
- مهارتهای آماری و ریاضی
- مهارتهای کلامی و تجسم دادهها
- مهندسی داده (Data Engineering)
مهندسان داده، مقادیر دادهها را که به سرعت در حال تغییر است، مدیریت میکنند. آنها بر توسعه، بهرهبرداری، مدیریت و بهینهسازی جریان دادهها تمرکز دارند و زیرساختهای مورد نیاز برای تبدیل و انتقال دادهها به دانشمندان داده را فراهم میکنند.
مهارتهای مورد نیاز برای یک مهندس داده هم شامل موارد زیر است:
- زبانهای برنامهنویسی (جاوا ، اسکالا)
- آشنایی با دیتابیس NoSQL (MongoDB, Cassandra DB)
- فریمورکها (Apache Hadoop)
رابطه دیتا ساینس و ماشین لرنینگ
علم داده و یادگیری ماشین دو مفهومی هستند که جزئی از حوزه فناوری و استفاده از دادهها قرار میگیرند و برای ایجاد و نوآوری محصولات، خدمات، سیستمهای زیرساختی و موارد دیگر استفاده میشوند. هر دو این حوزهها تقاضاهای زیاد و درآمدهای بالایی دارند.
نحوه شباهت دو حوزه را میتوان با این جمله نشان داد که «مربعها مستطیل هستند، اما مستطیلها مربع نیستند.»
در واقع علم داده یک مستطیل فراگیر است، در حالی که یادگیری ماشین مربعی است که موجودیت خودش را دارد. هر دو علم داده و ماشین لرنینگ، ابزار کار دانشمندان داده هستند و به سرعت در تمام صنایع مورد پذیرش قرار میگیرند.
به عبارت ساده، علم داده حوزهای است که دادهها و چگونگی استخراج معنا را از آن مطالعه میکند، در حالی که یادگیری ماشین زیرشاخه هوش مصنوعی است که به درک و ساخت روشهایی اختصاص دارد که از دادهها برای بهبود عملکرد یا پیشبینیها استفاده میکند.
در سالهای اخیر، یادگیری ماشین و هوش مصنوعی (AI) بخشهایی از علم داده بوده و نقش مهمی در تجزیه و تحلیل دادهها و هوش تجاری بازی میکنند. همچنین یادگیری ماشینی فرآیند تجزیه و تحلیل دادهها را خودکار میکند و پیشبینیهایی را بر اساس جمعآوری و تجزیه و تحلیل مقادیر زیادی از دادهها روی جمعیتهای خاص انجام میدهد.
مسیر یادگیری دیتا ساینس
قبل از این که درباره مسیر یادگیری علم داده صحبت کنیم، یک قدم به عقب برگردید و به این سوال فکر کنید که چرا میخواهید وارد کار در حوزه علم داده شوید؟ پاسخ این سوال مهم است؛ چرا که به شما کمک میکند تا متوجه شوید که در مسیر یادگیری علم داده روی چه حوزههایی باید بیشتر تمرکز کنید.
به این فکر کنید که چه چیزی در علم داده یا همان دیتا ساینس شما را هیجانزده میکند؟ کار کردن با دادههای خام و تبدیل آنها به اطلاعات مفید یا تعامل با بخشی از کار که منتج به قابلیتهای جدید در یک کسب و کار میشود؟ آیا ارائه و تصویرسازی از نتایج کاوش در دادهها برای شما جذاب است؟
همچنین باید به این موضوع فکر کنید که کار کردن با چه نوع دادهها را بیشتر دوست دارید؟ بعضی از افراد به کار کردن در یک حوزه خاص بیشتر از حوزههای دیگر علاقه دارند. مثلا بیشتر دوست دارید در حوزه پزشکی و دادههای مربوط به آن کار کنید یا با دادههای مالی سر و کار داشته باشید؟
خلاصه اینکه علم داده، مهارت پیشرفتهایست که قبل از ورود باید هدف خود را از یادگیری آن مشخص کنیم تا بتوانیم به یک حرفهای در این حوزه تبدیل شویم. حال وقت آن است که درباره مسیر یادگیری علم داده و مهارتهای مورد نیاز برای کار در این حوزه را با هم مرور کنیم.
مسیر یادگیری علم داده از یادگیری زبان پایگاه داده SQL و آموزش برنامهنویسی با زبان پایتون شروع میشود و با آموزش تجزیه و تحلیل داده با پایتون، یادگیری ماشین لرنینگ و عمیق شدن در آن ادامه پیدا میکند. نکته مهم این که با توجه به این که حوزههای مربوط به تکنولوژی هر روز در حال رشد هستند، باید در نظر داشته باشید که تمرین و یادگیری را نباید متوقف کنید.
علاوه بر این برای تبدیل شدن به این متخصص و حرفهای در زمینه علم داده چند مهارت کلیدی باید داشته باشید. برنامهنویسی، SQL، ریاضیات، آمار، داده کاوی، تجسم و تصویرسازی دادهها و یادگیری ماشین از جمله این مهارتها هستند.
درامد و بازار کار دیتا ساینس در ایران
وقتی درباره وضعیت بازار کار دانشمند داده در ایران جستجو میکنیم، به وضوح میبینیم که مرز بین شغلهای دادهمحور مختلف به قدری باریک است که گاهی حتی این مرز دیده نمیشود. با سرچ عنوان شغلی «دانشمند داده» یا «دیتا ساینس» در پلتفرمهای کاریابی داخلی، تعداد کمی از عناوین شغلی را دقیقا با همین عبارتها میبینیم؛ البته این به این دلیل نیست که نیاز برای دانشمندان داده در ایران وجود ندارد، بلکه دقیقا به این علت است که معمولا با عناوین دیگری مثل مهندس داده، تحلیلگر داده و امثالهم ترکیب میشود.
با این حال با کمی بررسی بیشتر متوجه میشویم که شرکتهای بزرگ داده محور که با حجم زیادی از دادهها سر و کار دارند، به دنبال دانشمندان داده هم هستند. به دلیل این که دانشمندان داده باید به دانشی مرکب از آمار، ریاضیات و علوم کامپیوتر مسلط باشند و از تواناییهای تحلیلی خوبی هم برخوردار باشند، شرکتها حاضرند پرداختیهای خوبی هم به شاغلان در حوزه داده داشته باشند.
پس اگر به دنبال یک درآمد ماهیانه نسبتا قابل توجه هستید و در عین حال از ریاضیات، آمار و علوم کامپیوتر لذت میبرید، کار کردن در حوزه علم داده میتواند گزینه خوبی برای شما باشد. همچنین با سر زدن به بخش «همکاری با ما» میتوانید فرصتهای شغلی یک دانشمند داده در ویستا سامانه آسا را هم ببینید و در صورت تمایل رزومهتان را برای ما ارسال کنید.
جمعبندی
در این مقاله سعی کردیم درباره علم داده، مسیرهای شغلی و مهارتهای مورد نیاز آن توضیحاتی ارائه کنیم. دادهها در دنیای امروز و برای هر کسب وکاری حیاتی هستند و تمام تصمیمگیریها و نتایج، با توجه به اطلاعات سنجیده میشوند. در ایران نیز استفاده از علم داده هر روز اهمیت بیشتری پیدا میکند و سازمانها نیاز و علاقه بیشتری برای استفاده از مهارت متخصصان این حوزه پیدا میکنند. فرصتهای شغلی بسیار خوبی در انتظار کسانی خواهد بود که در زمینه دیتا ساینس مهارتهای لازم را کسب کرده باشند. در صورتی که تجربه کار در این حوزه را دارید یا در سازمان خود از علم داده استفاده میکنید، خوشحال میشویم تجربه خود را با ما و خوانندگان این مقاله به اشتراک بگذارید.
دیدگاهتان را بنویسید