ین روزها علم داده یا Data Science یکی از موضوعات بسیار جذاب دنیای IT به شمار میرود؛ دانشی برای یک مسیر شغلی جدید که افراد زیادی داوطلب یادگیری آن هستند. دادهپردازان حرفهای به این نتیجه رسیدهاند که مهارتهای سنتی استفاده از کلان داده (Big Data)، آنالیز، تحلیل دادهها و مهارتهای برنامهنویسی آنها نیازمند بهروزرسانی و بهبود است. دانشمندان علم داده برای استفاده هوشمندانه از اطلاعات در سازمان خود، باید بر طیف کاملی از چرخه حیات علم داده تسلط داشته و دارای سطح انعطافپذیری و درک بالاتری برای بررسی بازدهی هر مرحله از فرآیند باشند. در این مقاله درباره دیتاساینس و تاریخچه آن صحبت میکنیم و موقعیتهای شغلی موجود در این زمینه را به شما معرفی خواهیم کرد.
تاریخچه دیتا ساینس
استفاده از اصطلاح دانشمند داده یا دیتا ساینتیست (Data Scientist) از سال ۲۰۰۸ رواج پیدا کرد. سازمانها پس از گسترش سریع دانش و افزایش قابل توجه دادهها به این نتیجه رسیدند که برای سازماندهی، تجزیه و تحلیل و کسب نتیجه کاربردی، نیاز به متخصصانی دارند که بتوانند دادههایی با حجم زیاد را پردازش کنند و از میان انبوه اطلاعاتی که ممکن است در نگاه اول حتی کاربردی به نظر نرسند، نتایج مورد انتظار سازمان را استخراج کنند.
در سال ۲۰۰۹ هال واریان (Hal Varian)، اقتصاددان ارشد گوگل و استاد دانشگاه برکلی در زمینههای علوم اطلاعات، تجارت و اقتصاد، مقالهای در McKinsey & Company به چاپ رساند و در آن به اهمیت سازگاری با تأثیرات فناوری اشاره و تغییر شکل مجدد صنایع مختلف را پیشبینی کرده بود:
«توانایی به دست آوردن داده، پردازش آن، ایجاد ارزش از داده و قابلیت تجسم بخشیدن به آن برای ایجاد معنا، مهارت بسیار مهمی در دهههای آینده خواهد بود.»
کار یک دانشمند داده چیست؟
در طول دهه گذشته و با سپری شدن زمان، دیتاساینتیستها تبدیل به یکی از اجزاء ضروری برای هر سازمانی شدهاند. این افراد در گردآوری اطلاعات و پردازش داده خبره هستند و دانش فنی بسیار خوبی دارند. آنها با استفاده از الگوریتمهای پیچیده و دانش بالا، مقادیر زیادی از اطلاعات را پردازش و سازماندهی میکنند. سپس با استفاده از این عملیات پاسخهای مورد نیاز سازمان را پیدا میکنند و در اجرای استراتژیهای سازمان، نقش موثری خواهند داشت.
یک دیتا ساینتیست حرفهای میتواند سوالات درستی مطرح کند و به آنها پاسخ دهد. او دادهها را از منابع مختلف جمعآوری و سازماندهی میکند و سپس نتایج را به راه حل تبدیل خواهد کرد. همچنین او یافتههای خود را به روشی منتقل میکند که بر تصمیمات تجاری، تأثیر مثبت بگذارد.
ویژگیهای یک دانشمند داده چیست؟
دانشمندان داده باید:
- کنجکاو و نتیجهگرا باشد.
- دانش و مهارتهای ارتباطی متناسب با صنعت مربوطه را داشته باشد.
- با داشتن این ویژگیها، بتواند نتایج فنی و تخصصی را برای همکاران خود توضیح دهد.
- دانشی قوی در زمینه آمار و جبر خطی و همچنین برنامهنویسی داشته باشد.
دیتاساینتیستها همچنین باید بتوانند از ابزارها و نرمافزارهای کلیدی استفاده کنند. نرمافزارهایی مانند موارد زیر در این دانش بیشتر مورد استفاده قرار می گیرند:
چرا دیتاساینیتست شویم؟
Glassdoor که یکی از معتبرترین سایتهای کاریابی در سراسر اروپا،کانادا و آمریکا است، دیتاساینتیست را برای سومین سال متوالی به عنوان بهترین شغل در آمریکا در سال ۲۰۱۸ انتخاب کرده بود. با دسترسی بیشتر به دادهها، شرکتهای بزرگ فناوری دیگر تنها گروهی نیستند که به دانشمندان داده احتیاج دارند.
تقاضای فزایندهای برای جایگاه شغلی متخصصان علوم داده در صنایع کوچک و بزرگ دیده میشود. کمبود نیروی متخصص در این حوزه هم یک چالش برای سازمانها به شمار میرود.
دیتاساینتیست به عنوان یکی از مورد نیازترین مشاغل در سال ۲۰۱۷ و ۲۰۱۸ معرفی شده است. از این عنوان شغلی به همراه مهارتهای متعدد مرتبط با علوم داده، به عنوان یکی از بیشترین درخواستهای شرکتها نام برده شده است.
آماری که در ادامه مشاهده میکنید، تقاضای قابل توجه و رو به رشد برای استخدام دانشمندان داده را نشان میدهد:
موقعیتهای شغلی در حوزه علم داده
دادهها گسترده هستند و در همه جا دیده میشوند. تعاریف شغلی و موقعیتهای کاری متنوعی در رابطه با استخراج، نظمدهی، تجزیه و تحلیل و تفسیر دادهها وجود دارد که اغلب به جای یکدیگر استفاده میشوند. در ادامه به بررسی تعدادی از اصطلاحات مورد استفاده در این حوزه میپردازیم:
دانشمند داده (Data Scientist)
یک دانشمند داده بررسی میکند که به کدام یک از سوالات باید پاسخ داده شود و از کجا میتوان دادههای مربوطه را پیدا کرد. او باید مهارتهایی مانند تجزیه و تحلیل، استخراج ، جداسازی و ارائه اطلاعات برخوردار باشد.
سازمانها از دانشمندان داده برای تهیه، مدیریت و تجزیه و تحلیل مقدار زیادی از دادههای غیر ساختاری بهره میبرند. این نتایج برای تصمیمگیری استراتژیک در سازمان استفاده میشود.
مهارتهای مورد نیاز برای یک دانشمند داده یا دیتا ساینتیست شامل موارد زیر است:
- مهارتهای برنامهنویسی (SAS, R, Python)
- مهارتهای آماری و ریاضی
- مهارتهای کلامی و تجسم دادهها
- Hadoop
- SQL
- یادگیری ماشین یا همان ماشین لرنینگ
تحلیلگر داده (Data Analyst)
تحلیلگران داده، فاصله بین تحلیلگران تجارت و منطق موجود در دادهها را برطرف میکنند. سوالاتی که در سازمان نیاز به پاسخ دارد، به آنها ارجاع داده میشود. تحلیلگران، دادهها را سازماندهی و تجزیه و تحلیل میکنند تا نتایجی را پیدا کنند که با استراتژیها و نیازهای کسب و کار همسو باشد. تحلیلگران داده وظیفه دارند تجزیه و تحلیلهای تخصصی خود را به صورت اقدامات کیفی و قابل اجرا بیان کنند و یافتهها را به سازمان ارائه دهند.
مهارتهای مورد نیاز برای یک تحلیلگر داده شامل موارد زیر است:
- مهارتهای برنامهنویسی (SAS, R, Python )
- مهارتهای آماری و ریاضی
- مهارتهای کلامی و تجسم دادهها
- مهندس داده (Data Engineer)
مهندسان داده، مقادیر دادهها را که به سرعت در حال تغییر است، مدیریت میکنند. آنها بر توسعه، بهرهبرداری، مدیریت و بهینهسازی جریان دادهها تمرکز دارند و زیرساختهای مورد نیاز برای تبدیل و انتقال دادهها به دانشمندان داده را فراهم میکنند.
مهارتهای مورد نیاز برای یک مهندس داده هم شامل موارد زیر است:
- زبانهای برنامهنویسی (جاوا ، اسکالا)
- آشنایی با دیتابیس NoSQL (MongoDB, Cassandra DB)
- فریم ورکها (Apache Hadoop)
رابطه دیتا ساینس و ماشین لرنینگ
علم داده و یادگیری ماشین دو مفهومی هستند که جزئی از حوزه فناوری و استفاده از دادهها قرار میگیرند و برای ایجاد و نوآوری محصولات، خدمات، سیستمهای زیرساختی و موارد دیگر استفاده میشوند. هر دو این حوزهها تقاضاهای زیاد و درآمدهای بالایی دارند.
نحوه شباهت دو حوزه را میتوان با این جمله نشان داد که «مربعها مستطیل هستند، اما مستطیلها مربع نیستند.»
در واقع علم داده یک مستطیل فراگیر است، در حالی که یادگیری ماشین مربعی است که موجودیت خودش را دارد. هر دو علم داده و ماشین لرنینگ، ابزار کار دانشمندان داده هستند و به سرعت در تمام صنایع مورد پذیرش قرار میگیرند.
به عبارت ساده، علم داده حوزهای است که دادهها و چگونگی استخراج معنا را از آن مطالعه میکند، در حالی که یادگیری ماشین زیرشاخه هوش مصنوعی است که به درک و ساخت روشهایی اختصاص دارد که از دادهها برای بهبود عملکرد یا پیشبینیها استفاده میکند.
در سالهای اخیر، یادگیری ماشین و هوش مصنوعی (AI) بخشهایی از علم داده بوده و نقش مهمی در تجزیه و تحلیل دادهها و هوش تجاری بازی میکنند. همچنین یادگیری ماشینی فرآیند تجزیه و تحلیل دادهها را خودکار میکند و پیشبینیهایی را بر اساس جمعآوری و تجزیه و تحلیل مقادیر زیادی از دادهها روی جمعیتهای خاص انجام میدهد.
مسیر یادگیری دیتا ساینس
قبل از این که درباره مسیر یادگیری علم داده صحبت کنیم، یک قدم به عقب برگردید و به این سوال فکر کنید که چرا میخواهید وارد کار در حوزه علم داده شوید؟ پاسخ این سوال مهم است؛ چرا که به شما کمک میکند تا متوجه شوید که در مسیر یادگیری علم داده روی چه حوزههایی باید بیشتر تمرکز کنید.
به این فکر کنید که چه چیزی در علم داده یا همان دیتا ساینس شما را هیجانزده میکند؟ کار کردن با دادههای خام و تبدیل آنها به اطلاعات مفید یا تعامل با بخشی از کار که منتج به قابلیتهای جدید در یک کسب و کار میشود؟ آیا ارائه و تصویرسازی از نتایج کاوش در دادهها برای شما جذاب است؟
همچنین باید به این موضوع فکر کنید که کار کردن با چه نوع دادهها را بیشتر دوست دارید؟ بعضی از افراد به کار کردن در یک حوزه خاص بیشتر از حوزههای دیگر علاقه دارند. مثلا بیشتر دوست دارید در حوزه پزشکی و دادههای مربوط به آن کار کنید یا با دادههای مالی سر و کار داشته باشید؟
خلاصه اینکه علم داده، مهارت پیشرفتهایست که قبل از ورود باید هدف خود را از یادگیری آن مشخص کنیم تا بتوانیم به یک حرفهای در این حوزه تبدیل شویم. حال وقت آن است که درباره مسیر یادگیری علم داده و مهارتهای مورد نیاز برای کار در این حوزه را با هم مرور کنیم.
مسیر یادگیری علم داده از یادگیری زبان پایگاه داده SQL و آموزش برنامهنویسی با زبان پایتون شروع میشود و با آموزش تجزیه و تحلیل داده با پایتون، یادگیری ماشین لرنینگ و عمیق شدن در آن ادامه پیدا میکند. نکته مهم این که با توجه به این که حوزههای مربوط به تکنولوژی هر روز در حال رشد هستند، باید در نظر داشته باشید که تمرین و یادگیری را نباید متوقف کنید.
علاوه بر این برای تبدیل شدن به این متخصص و حرفهای در زمینه علم داده چند مهارت کلیدی باید داشته باشید. برنامهنویسی، SQL، ریاضیات، آمار، داده کاوی، تجسم و تصویرسازی دادهها و یادگیری ماشین از جمله این مهارتها هستند.
درامد و بازار کار دیتا ساینس در ایران
وقتی درباره وضعیت بازار کار دانشمند داده در ایران جستجو میکنیم، به وضوح میبینیم که مرز بین شغلهای دادهمحور مختلف به قدری باریک است که گاهی حتی این مرز دیده نمیشود. با سرچ عنوان شغلی «دانشمند داده» یا «دیتا ساینس» در پلتفرمهای کاریابی داخلی، تعداد کمی از عناوین شغلی را دقیقا با همین عبارتها میبینیم؛ البته این به این دلیل نیست که نیاز برای دانشمندان داده در ایران وجود ندارد، بلکه دقیقا به این علت است که معمولا با عناوین دیگری مثل مهندس داده، تحلیلگر داده و امثالهم ترکیب میشود.
با این حال با کمی بررسی بیشتر متوجه میشویم که شرکتهای بزرگ داده محور که با حجم زیادی از دادهها سر و کار دارند، به دنبال دانشمندان داده هم هستند. به دلیل این که دانشمندان داده باید به دانشی مرکب از آمار، ریاضیات و علوم کامپیوتر مسلط باشند و از تواناییهای تحلیلی خوبی هم برخوردار باشند، شرکتها حاضرند پرداختیهای خوبی هم به شاغلان در حوزه داده داشته باشند.
پس اگر به دنبال یک درآمد ماهیانه نسبتا قابل توجه هستید و در عین حال از ریاضیات، آمار و علوم کامپیوتر لذت میبرید، کار کردن در حوزه علم داده میتواند گزینه خوبی برای شما باشد. همچنین با سر زدن به بخش «همکاری با ما» میتوانید فرصتهای شغلی یک دانشمند داده در ویستا سامانه آسا را هم ببینید و در صورت تمایل رزومهتان را برای ما ارسال کنید.
جمعبندی
در این مقاله سعی کردیم درباره علم داده، مسیرهای شغلی و مهارتهای مورد نیاز آن توضیحاتی ارائه کنیم. دادهها در دنیای امروز و برای هر کسب وکاری حیاتی هستند و تمام تصمیمگیریها و نتایج، با توجه به اطلاعات سنجیده میشوند. در ایران نیز استفاده از علم داده هر روز اهمیت بیشتری پیدا میکند و سازمانها نیاز و علاقه بیشتری برای استفاده از مهارت متخصصان این حوزه پیدا میکنند. فرصتهای شغلی بسیار خوبی در انتظار کسانی خواهد بود که در زمینه دیتا ساینس مهارتهای لازم را کسب کرده باشند. در صورتی که تجربه کار در این حوزه را دارید یا در سازمان خود از علم داده استفاده میکنید، خوشحال میشویم تجربه خود را با ما و خوانندگان این مقاله به اشتراک بگذارید.
دیدگاهتان را بنویسید