بازنگری مصاحبه‌های علوم داده در عصر هوش مصنوعی

هوش مصنوعی در حال بازنویسی روال روزمره دانشمندان داده است .برای حفظ رقابتدانشمندان داده باید یاد بگیرند که چگونه بهره‌وری را بهبود بخشند و امکانات جدیدی را با هوش مصنوعی ایجاد کنند. در همین حال، این تحول همچنین چالشی را برای مدیران استخدام ایجاد می‌کند: چگونه بهترین استعدادی را که در دوران هوش مصنوعی شکوفا می‌شود، پیدا کنیم؟ یک گام مهم در ایجاد یک تیم داده قوی مبتنی بر هوش مصنوعی، اصلاح فرآیند استخدام برای ارزیابی بهتر توانایی کاندیداها برای کار در کنار هوش مصنوعی است. 

در این مقاله، دیدگاه خود را در مورد چگونگی تکامل مصاحبه‌های دانشمند داده در عصر هوش مصنوعی به اشتراک خواهم گذاشت. اگرچه تمرکز من در اینجا بر نقش‌های تحلیلگر داده (DSA) است، ایده‌های اینجا در مورد سایر موقعیت‌های داده، مانند مهندسان یادگیری ماشین (MLE) نیز صدق می‌کند. 


۱. چرخه مصاحبه سنتی دانشمند داده

قبل از صحبت در مورد چگونگی تغییر اوضاع، بیایید ساختار فعلی مصاحبه‌های دانشمند داده را بررسی کنیم. گذشته از تماس اولیه استخدام‌کننده و غربالگری مدیر استخدام، یک فرآیند مصاحبه معمولی دانشمند داده شامل موارد زیر است:

  1. مصاحبه‌های کدنویسی : سوالات کدنویسی SQL یا Python برای سنجش نحو و منطق پایه.
  2. مصاحبه‌های آماری : سوالات آمار و احتمال، و همچنین رایج‌ترین کاربردهای آماری در گردش‌های کاری علوم داده، مانند تست A/B و استنتاج علی.
  3. مصاحبه‌های یادگیری ماشین : بررسی عمیق الگوریتم‌ها، تجربیات و موارد یادگیری ماشین
  4. مصاحبه‌های موردی کسب‌وکار : یک مسئله فرضی را برای آزمایش تفکر تحلیلی و درک کسب‌وکار – معیارها، قیف‌ها، رشد، استراتژی‌های حفظ مشتری و رویکردهای تحلیلی – مورد بحث قرار دهید.
  5. مصاحبه‌های رفتاری : مصاحبه استاندارد «من را در یک پروژه/زمانی که شما XXX هستید، راهنمایی کنید» برای درک اینکه کاندیداها چگونه موقعیت‌های خاص را مدیریت می‌کنند و آیا از نظر فرهنگی با آنها سازگار هستند یا خیر. 
  6. مصاحبه‌های بین‌بخشی : دانشمند داده یک نقش فنی است، اما همچنین بسیار بین‌بخشی است و هدف آن ایجاد تأثیر واقعی بر کسب‌وکار با استفاده از داده‌ها است. بنابراین، بسیاری از حلقه‌های مصاحبه دانشمند داده امروزه شامل یک دور مصاحبه بین‌بخشی برای گفتگو با یک شریک تجاری برای ارزیابی دانش دامنه، مهارت‌های ارتباطی و همکاری با ذینفعان هستند. 

از لیست بالا، می‌توانید ببینید که مصاحبه‌های دانشمند داده معمولاً ترکیبی خوب از ارزیابی‌های فنی و غیرفنی دارند. اما با ورود هوش مصنوعی به بازی، برخی از این مصاحبه‌ها به طور قابل توجهی تغییر خواهند کرد، در حالی که برخی دیگر حتی مهم‌تر می‌شوند. بیایید آن را تجزیه و تحلیل کنیم.


دوم. چگونه مصاحبه‌ها در عصر هوش مصنوعی تغییر خواهند کرد

به نظر من، اینکه حلقه‌های مصاحبه چگونه تغییر خواهند کرد به دو چیز بستگی دارد: ۱. آیا هوش مصنوعی می‌تواند به سرعت از عهده‌ی این کار برآید؟ ۲. آیا نشان می‌دهد که کاندیدا چگونه با فکر از هوش مصنوعی استفاده می‌کند؟ 

مصاحبه‌های کدنویسی: به احتمال زیاد ابتدا تغییر می‌کنند

هوش مصنوعی چه کارهایی را می‌تواند به سرعت انجام دهد؟ وظایف ساده کدنویسی. بنابراین، مصاحبه کدنویسی احتمالاً اولین مصاحبه‌ای است که تحت تأثیر قرار می‌گیرد. 

مصاحبه‌های کدنویسی امروزی از داوطلبان می‌خواهند که کدهای SQL و پایتون را به درستی بنویسند. سوالات SQL معمولاً به joinهای ساده، CTEها، aggregationها و توابع پنجره‌ای نیاز دارند. و سوالات پایتون می‌توانند دستکاری ساده داده‌ها با pandas و numpy یا سوالات آسان به سبک LeetCode باشند. اما بیایید صادق باشیم، این سوالات مصاحبه امروزه به راحتی توسط هوش مصنوعی قابل حل هستند. در مقاله‌ام که یک سال پیش نوشتم، عملکرد ChatGPT، Claude و Gemini را در وظایف ساده SQL ارزیابی کردم و از قبل تحت تأثیر هر سه قرار گرفتم – Claude 3.5 Sonnet حتی در آزمون من امتیاز کامل را کسب کرد. 

بیایید یک قدم به عقب برداریم. برای دانشمندان داده، چالش واقعی کدنویسی امروز از ۱. درک داده‌ها و یافتن جداول و فیلدهای صحیح؛ ۲. ترجمه سوالات داده‌ای شما به پرس‌وجو/کد صحیح ناشی می‌شود. به عبارت دیگر، مصاحبه‌های کدنویسی امروزی عمدتاً نحو پایه را می‌سنجند، که ممکن است برای داوطلبان سطح مبتدی منصفانه باشد، اما مدت‌هاست که حتی بدون تکامل هوش مصنوعی، در ارزیابی حل مسئله واقعی شکست خورده‌اند. این واقعیت که هوش مصنوعی می‌تواند به سرعت به آنها پاسخ دهد، فقط این دور را قدیمی‌تر می‌کند. 

بنابراین، چگونه می‌توانیم مصاحبه‌های کدنویسی را معنادارتر کنیم؟ من فکر می‌کنم، اولاً، باید به کاندیداها اجازه دهیم در طول مصاحبه کدنویسی از ابزارهای هوش مصنوعی مانند GitHub Copilot یا Cursor استفاده کنند تا محیط کار جدید با هوش مصنوعی را شبیه‌سازی کنند. من شاهد وقوع تدریجی این اتفاق در صنعت بوده‌ام. به عنوان مثال، Canva اخیراً مصاحبه‌های کدنویسی با کمک هوش مصنوعی را معرفی کرد و Greenhouse همچنین می‌گوید : « ما از استفاده شفاف از هوش مصنوعی مولد در فرآیند مصاحبه برای نقش‌های خاص استقبال می‌کنیم، با این انتظار که کاندیداها بتوانند سوالاتی را که ایجاد می‌کنند به طور کامل توضیح دهند و/یا تصمیمات فنی که می‌گیرند را به طور عمیق مورد بحث قرار دهند. » من فکر می‌کنم اجازه دادن به کاندیداها برای استفاده از هوش مصنوعی بهتر از تلاش برای جلوگیری از تقلب آنها با هوش مصنوعی است، زیرا آنها به هر حال از هوش مصنوعی در محل کار استفاده خواهند کرد (و انتظار می‌رود که استفاده کنند) :). 

در همین حال، به جای پرسیدن سوالات ساده SQL/Python، چند ایده دارم:

  1. در حالت ایده‌آل، می‌توانیم محیطی با جداول مستند متعدد ایجاد کنیم و از داوطلبان بخواهیم که با کمک هوش مصنوعی یک جلسه حل مسئله زنده انجام دهند. به جای پرسیدن سوالاتی مانند «نوشتن یک کوئری برای محاسبه میانگین ماهانه مشتری از سال ۲۰۲۴»، سوالات بازتری مانند «چگونه ریزش مشتری از سال ۲۰۲۴ را بررسی می‌کنید؟» بپرسید. ارزیابی نه تنها بر اساس دقت کد، بلکه بر اساس نحوه چارچوب‌بندی تحلیل و تفسیر نتایج توسط داوطلبان نیز خواهد بود. و هنگامی که داوطلب با ابزار هوش مصنوعی تعامل می‌کند، چگونه خروجی را درخواست، تکرار و ارزیابی می‌کند. اگرچه این کار مصاحبه‌کنندگان را سخت‌تر می‌کند – آنها باید با مجموعه داده‌ها بسیار آشنا باشند و بتوانند منطق داوطلبان را دنبال کنند، سوالات تکمیلی بپرسند و پاسخ‌ها را ارزیابی کنند. 
  2. از طرف دیگر، می‌توانیم از داوطلبان بخواهیم خروجی‌های هوش مصنوعی را ارزیابی کنند – این احتمالاً راه‌اندازی آسان‌تری دارد و نسبت به قالب بالا، استرس و زمان کمتری می‌برد. اگرچه هوش مصنوعی می‌تواند به کدنویسی کمک کند، اما همچنان مسئولیت ارزیابی خروجی بر عهده انسان‌ها است. هر کد تولید شده توسط هوش مصنوعی درست نیست، حتی اگر بدون خطا اجرا شود. مصاحبه‌کننده می‌تواند کاری را که سعی در انجام آن دارند شرح دهد و کد تولید شده توسط هوش مصنوعی را نشان دهد، سپس از داوطلبان بخواهد که تشخیص دهند آیا منطق صحیح است، آیا موارد حاشیه‌ای را نادیده می‌گیرد، آیا جایگزین‌های بهتری وجود دارد یا اینکه آیا کد می‌تواند بیشتر بهینه شود – این امر مستلزم آن است که داوطلب نحوه ترجمه بین منطق تجاری و کد را به طور کامل درک کند. همچنین طراحی یک روبریک استاندارد با این مجموعه مسئله آسان‌تر است. 

مصاحبه‌های آمار و یادگیری ماشین: نظریه کمتر، زمینه بیشتر

در ادامه، بیایید در مورد مصاحبه‌های آمار و یادگیری ماشین صحبت کنیم . هوش مصنوعی معلم بسیار خوبی است – مفاهیم اولیه آمار و یادگیری ماشین را به روشنی توضیح می‌دهد و می‌تواند به طوفان فکری در مورد روش‌های مختلف کمک کند – سعی کنید از ChatGPT بپرسید: “مقدار p را طوری برای من توضیح بده که انگار پنج سالم است”. با این حال، دانستن نظریه‌ها همیشه به معنای به کارگیری روش‌های مناسب بر اساس سناریوهای تجاری نیست. می‌توانید مثال خوبی را در مقاله ارزیابی عامل علوم داده گوگل من پیدا کنید – این کار در راه‌اندازی یک چارچوب مدل‌سازی با کد اولیه کاربردی عالی عمل می‌کند، اما به یک بیان مسئله واضح و یک مجموعه داده تمیز نیاز دارد. تخصص انسانی نیز برای مهندسی ویژگی، انتخاب بهترین شیوه‌های علوم داده خاص دامنه و تنظیم مدل‌ها ضروری است. با توجه به این نکته، فکر می‌کنم مصاحبه‌های آمار و یادگیری ماشین باید سوالات نظری یا مدل‌های کدنویسی کمتری از ابتدا بپرسند، اما بیشتر با مصاحبه‌های موردی تجاری ادغام شوند تا بررسی شود که آیا داوطلبان می‌توانند نظریه‌ها را در یک زمینه تجاری به کار گیرند یا خیر. بنابراین به جای پرسیدن سوالات جداگانه‌ای مانند “تفاوت بین رگرسیون ریج و لاسو چیست؟” یا «چگونه حجم نمونه را برای یک آزمون A/B محاسبه کنیم؟»، یک مسئله دنیای واقعی را ارائه دهید و مشاهده کنید که داوطلبان چگونه به صورت تحلیلی به سوالات پاسخ می‌دهند، آیا روش‌های پیشنهادی منطقی هستند و آیا ایده‌های خود را به صورت منطقی بیان می‌کنند. اینطور نیست که دیگر نیازی به داشتن آمار و دانش قوی در مورد یادگیری ماشین توسط داوطلبان نداشته باشیم، اما در بحث موردی، دانش را به طور یکپارچه‌تری آزمایش خواهیم کرد. به عنوان مثال، هنگام بررسی یک مورد فرضی تشخیص تقلب، می‌توانیم بپرسیم که چرا داوطلب XGBoost را به جای جنگل تصادفی پیشنهاد می‌کند و آیا بهتر است مقادیر از دست رفته در درآمد خانوار را به عنوان میانه یا صفر در نظر بگیریم.  

خبر خوب این است که ما قبلاً بسیاری از این مصاحبه‌های فنی + تجاری را در صنعت دیده‌ایم. پیش‌بینی من این است که هوش مصنوعی آن را حتی غالب‌تر خواهد کرد.  

مصاحبه‌های رفتاری و بین‌بخشی: تقریباً بدون تغییر، اما با تغییرات جدید

برای دو نوع مصاحبه باقی‌مانده، مصاحبه‌های رفتاری و مصاحبه‌های بین‌بخشی ، احتمالاً در اینجا باقی خواهند ماند. آن‌ها مهارت‌های نرم کاندیداها، مانند همکاری بین‌بخشی، ارتباطات، حل تعارض و مالکیت، و همچنین دانش حوزه‌ای آن‌ها را ارزیابی می‌کنند. اینها چیزهایی هستند که هوش مصنوعی نمی‌تواند جایگزین آن‌ها شود. با این حال، ممکن است تغییراتی در سوالاتی که افراد می‌پرسند، ایجاد شود. مصاحبه‌کنندگان می‌توانند سوالاتی در مورد تجربه گذشته کاندیداها با ابزارهای هوش مصنوعی اضافه کنند تا اطلاعات بیشتری در مورد نحوه استفاده آن‌ها از هوش مصنوعی برای افزایش بهره‌وری و حل مشکلات به دست آورند. به عنوان مثال، یک مدیر محصول ممکن است بپرسد: «چگونه می‌توانیم از هوش مصنوعی برای بهبود جذب مشتری استفاده کنیم؟» این مکالمات می‌تواند توانایی کاندیداها را در شناسایی موارد استفاده هوش مصنوعی که ارزش واقعی کسب‌وکار را ایجاد می‌کنند، آشکار کند.

تکالیف خانگی: هنوز بحث‌برانگیز، اما مفید

علاوه بر این قالب‌های رایج مصاحبه، یک قالب بحث‌برانگیز نیز وجود دارد که هر از گاهی در حلقه‌های مصاحبه علوم داده مطرح می‌شود – تکالیف خانگی . این نوع تکالیف معمولاً به شکل ارائه یک مجموعه داده و درخواست از داوطلبان برای انجام تجزیه و تحلیل یا ساخت یک مدل است. گاهی اوقات سوالات راهنما وجود دارد، گاهی اوقات نه. نتایج از یک دفترچه یادداشت Jupyter گرفته تا یک مجموعه اسلاید مرتب و تمیز متغیر است. 

می‌دانم کاندیداهایی هستند که واقعاً از آن متنفرند. این کار تلاش زیادی می‌طلبد – اگرچه استخدام‌کنندگان همیشه می‌گویند که کاندیداها به طور متوسط ​​حدود ۴ ساعت وقت صرف می‌کنند، اما زمان واقعی که شما صرف می‌کنید معمولاً به طور قابل توجهی بیشتر است، زیرا می‌خواهید جامع باشید و بهترین کار خود را به نمایش بگذارید. و چیزی که اوضاع را بدتر می‌کند این است که کاندیداها ممکن است بدون اینکه حتی فرصتی برای صحبت با تیم داشته باشند، رد شوند – چقدر ناامیدکننده! همانطور که انتظار می‌رفت، مدتی پیش از مسئول استخدام تیمم شنیدم که تکالیف خانگی منجر به نرخ بالای انصراف در فرآیند استخدام می‌شود (بنابراین آن را حذف کردیم). 

اما تکالیف خانگی ارزش دارند. این تکالیف مهارت‌های جامعی را از چارچوب‌بندی مسئله، کدنویسی، نوشتن گرفته تا ارائه، می‌سنجند. و ماهیت کار با محیط محلی شما با ابزارهای مورد علاقه‌تان اکنون به این معنی است که می‌توانید از هوش مصنوعی برای تکمیل سریع‌تر و بهتر تکالیف کمک بگیرید! بنابراین، تکالیف خانگی می‌توانند به راحتی در این دوره جدید تکامل یافته و رایج‌تر شوند، با انتظارات بالاتر برای عمق، تفسیر و اصالت. با این حال، چالش این است که مدیران استخدام، تکلیفی را ارائه دهند که هوش مصنوعی به راحتی نتواند آن را حل کند یا فقط حداقل راه‌حل قابل قبول را تولید کند. به عنوان مثال، یک کار ساده دستکاری داده‌ها مناسب نخواهد بود، اما یک سوال باز که نیاز به فرضیه‌سازی بر اساس دانش دامنه، بحث در مورد بده بستان و اولویت‌بندی دارد، بهتر جواب خواهد داد. و یک مصاحبه زنده بعدی همیشه برای اعتبارسنجی درک مفید است. 

حالا بیایید قالب‌های مصاحبه سنتی را در مقابل قالب‌های جدید در دوران هوش مصنوعی خلاصه کنیم:

قالب مصاحبه قالب سنتی قالب مقاوم در برابر هوش مصنوعی/قدرتمند در برابر هوش مصنوعی
کدنویسی SQL/پایتون سوالات متمرکز بر نحو در مورد دستکاری داده‌ها یا سوالات الگوریتم آسان به سبک LeetCode. اجازه استفاده از هوش مصنوعی را بدهید. به سمت حل مسئله زنده با کمک هوش مصنوعی بروید، یا از داوطلبان بخواهید خروجی‌های هوش مصنوعی را ارزیابی کنند. 
آمار و یادگیری ماشین سوالات نظری یا ساختن مدل‌ها از ابتدا. تفکر آماری را در یک زمینه تجاری ارزیابی کنید. از سناریوهای تجاری برای ارزیابی انتخاب روش، فرضیات و بده‌بستان‌ها استفاده کنید.
مصاحبه‌های مربوط به پرونده‌های تجاری رشد، معیارهای قیف فروش و استراتژی حفظ مشتری را در موقعیت‌های فرضی مورد بحث قرار دهید. ادغام بیشتر با آمار/یادگیری ماشین. توانایی کاندیدا را در چارچوب‌بندی مشکلات و به‌کارگیری ابزارهای مناسب ارزیابی کنید.
مصاحبه‌های رفتاری و بین‌بخشی ارتباطات، همکاری ذینفعان، دانش تخصصی و تناسب فرهنگی را ارزیابی کنید. ساختار مشابه، اما احتمالاً سوالات جدیدی در مورد تجربیات و موارد استفاده هوش مصنوعی.
تکالیف بیرون‌بر تجزیه و تحلیل داده‌ها یا ساخت یک مدل. این کار می‌تواند زمان‌بر باشد. ارسال آثار با کمک هوش مصنوعی مجاز یا مورد انتظار است. تکلیفی با پایان باز که بر عمق، اصالت و قضاوت تمرکز خواهد داشت.

III. این برای کاندیداها چه معنایی دارد؟

در بالا، نظر من در مورد چگونگی تغییر حلقه‌های مصاحبه دانشمندان داده در عصر هوش مصنوعی آمده است. با این حال، این تغییرات ممکن است مدتی طول بکشد، به خصوص در شرکت‌های بزرگی که فرآیند استخدام استاندارد و جاافتاده‌ای دارند.

بنابراین، داوطلبان برای آمادگی بهتر از قبل چه باید بکنند؟ 

  1. بدانید چه زمانی و چگونه با فکر از هوش مصنوعی استفاده کنید . از آنجایی که شرکت‌ها شروع به اجازه استفاده از هوش مصنوعی می‌کنند و حتی نحوه استفاده شما از هوش مصنوعی را در طول مصاحبه‌ها ارزیابی می‌کنند، درک نحوه استفاده با فکر از آن بسیار مهم می‌شود. فقط به نوشتن و چسباندن اکتفا نکنید. باید بفهمید هوش مصنوعی در چه زمینه‌هایی خوب عمل می‌کند و در کجا نقص دارد و چگونه خروجی‌ها را ارزیابی کنید. ناگفته نماند که هوش مصنوعی همچنین ابزاری بسیار مفید در آماده‌سازی مصاحبه است. می‌تواند به شما در درک بهتر موقعیت شغلی، تنظیم یک برنامه آماده‌سازی و انجام مصاحبه‌های آزمایشی کمک کند – می‌توانم یک مقاله کامل در این مورد بنویسم (شاید دفعه بعد). 
  2. کسب و کار را عمیقاً درک کنید . اکنون که مهارت‌های فنی با کمک هوش مصنوعی آسان‌تر می‌شوند، درک کسب و کار و دانش حوزه کاری به کلید تمایز یک کاندیدا تبدیل می‌شود. بنابراین، همه باید بیشتر با ذینفعان در محل کار همکاری کنند تا دانش کسب و کار خود را توسعه دهند. و هنگامی که برای مصاحبه آماده می‌شوید، برای تحقیق در مورد شرکت وقت بگذارید تا محصول آن را بفهمید – معیارهای کلیدی چیست، چگونه می‌توان محصول را با داده‌ها بیشتر رشد داد و استراتژی حفظ مشتری چگونه باید باشد.

فهرست مطالب

پیمایش به بالا