آلفاژنوم: هوش مصنوعی برای درک بهتر ژنوم

معرفی یک مدل توالی DNA جدید و یکپارچه که پیش‌بینی اثر انواع تنظیمی را پیش می‌برد و نویدبخش روشن شدن عملکرد ژنوم است – اکنون از طریق API در دسترس است.

ژنوم، دفترچه راهنمای سلولی ماست. این مجموعه کامل DNA است که تقریباً هر بخش از یک موجود زنده را از ظاهر و عملکرد گرفته تا رشد و تولید مثل هدایت می‌کند. تغییرات کوچک در توالی DNA یک ژنوم می‌تواند پاسخ یک موجود زنده به محیط یا حساسیت آن به بیماری را تغییر دهد. اما رمزگشایی نحوه خواندن دستورالعمل‌های ژنوم در سطح مولکولی – و اینکه وقتی یک تغییر کوچک DNA رخ می‌دهد چه اتفاقی می‌افتد – هنوز یکی از بزرگترین اسرار زیست‌شناسی است.

امروز، ما AlphaGenome را معرفی می‌کنیم ، یک ابزار جدید هوش مصنوعی (AI) که به طور جامع‌تر و دقیق‌تری پیش‌بینی می‌کند که چگونه انواع یا جهش‌های تکی در توالی‌های DNA انسان بر طیف وسیعی از فرآیندهای بیولوژیکی تنظیم‌کننده ژن‌ها تأثیر می‌گذارند. این امر، در کنار عوامل دیگر، با پیشرفت‌های فنی امکان‌پذیر شده است که به مدل اجازه می‌دهد توالی‌های طولانی DNA را پردازش کند و پیش‌بینی‌های با وضوح بالا ارائه دهد.

برای پیشبرد تحقیقات علمی، ما AlphaGenome را از طریق API AlphaGenome خود برای تحقیقات غیرتجاری به صورت پیش‌نمایش در دسترس قرار می‌دهیم و قصد داریم این مدل را در آینده منتشر کنیم.

ما معتقدیم که آلفاژنوم می‌تواند منبع ارزشمندی برای جامعه علمی باشد و به دانشمندان کمک کند تا عملکرد ژنوم، زیست‌شناسی بیماری‌ها را بهتر درک کنند و در نهایت، اکتشافات بیولوژیکی جدید و توسعه درمان‌های جدید را هدایت کنند.

نحوه کار آلفاژنوم

مدل AlphaGenome ما یک توالی DNA طولانی – تا ۱ میلیون حرف، که به عنوان جفت باز نیز شناخته می‌شود – را به عنوان ورودی دریافت می‌کند و هزاران ویژگی مولکولی را که فعالیت تنظیمی آن را توصیف می‌کنند، پیش‌بینی می‌کند. همچنین می‌تواند با مقایسه پیش‌بینی‌های توالی‌های جهش‌یافته با توالی‌های جهش‌نیافته، اثرات انواع یا جهش‌های ژنتیکی را امتیازدهی کند.

ویژگی‌های پیش‌بینی‌شده شامل محل شروع و پایان ژن‌ها در انواع سلول‌ها و بافت‌های مختلف، محل پیرایش آنها، میزان RNA تولید شده و همچنین بازهای DNA قابل دسترسی، نزدیک به یکدیگر یا متصل به پروتئین‌های خاص است. داده‌های آموزشی از کنسرسیوم‌های عمومی بزرگی از جمله ENCODE ، GTEx ، 4D Nucleome و FANTOM5 تهیه شده است که به صورت تجربی این ویژگی‌ها را که شامل روش‌های مهم تنظیم ژن در صدها نوع سلول و بافت انسان و موش است، اندازه‌گیری کرده‌اند.

انیمیشنی که AlphaGenome را نشان می‌دهد که یک میلیون حرف DNA را به عنوان ورودی می‌گیرد و خواص مولکولی متنوع را در بافت‌ها و انواع سلول‌های مختلف پیش‌بینی می‌کند.

معماری AlphaGenome از لایه‌های کانولوشن برای تشخیص اولیه الگوهای کوتاه در توالی ژنوم، از مبدل‌ها برای انتقال اطلاعات در تمام موقعیت‌های توالی و از یک سری لایه‌های نهایی برای تبدیل الگوهای شناسایی شده به پیش‌بینی‌هایی برای روش‌های مختلف استفاده می‌کند. در طول آموزش، این محاسبه در چندین واحد پردازش تنسور (TPU) به هم پیوسته برای یک توالی واحد توزیع می‌شود.

این مدل بر اساس مدل ژنومیک قبلی ما، Enformer، ساخته شده و مکمل AlphaMissense است که در دسته‌بندی اثرات گونه‌ها در مناطق کدکننده پروتئین تخصص دارد. این مناطق 2٪ از ژنوم را پوشش می‌دهند. 98٪ باقی‌مانده که مناطق غیر کدکننده نامیده می‌شوند، برای هماهنگ‌سازی فعالیت ژن بسیار مهم هستند و شامل گونه‌های زیادی مرتبط با بیماری‌ها می‌باشند. AlphaGenome دیدگاه جدیدی برای تفسیر این توالی‌های گسترده و گونه‌های درون آنها ارائه می‌دهد.

ویژگی‌های متمایز AlphaGenome

آلفاژنوم در مقایسه با مدل‌های توالی DNA موجود، چندین ویژگی متمایز ارائه می‌دهد:

توالی-زمینه طولانی با وضوح بالا

مدل ما تا ۱ میلیون حرف DNA را تجزیه و تحلیل می‌کند و پیش‌بینی‌هایی را با وضوح حروف منفرد انجام می‌دهد. زمینه توالی طولانی برای پوشش مناطق تنظیم‌کننده ژن‌ها از دوردست مهم است و وضوح پایه برای ثبت جزئیات بیولوژیکی دقیق مهم است.

مدل‌های قبلی مجبور بودند بین طول توالی و وضوح تعادل برقرار کنند، که این امر طیف روش‌هایی را که می‌توانستند به طور مشترک مدل‌سازی و پیش‌بینی دقیق کنند، محدود می‌کرد. پیشرفت‌های فنی ما این محدودیت را بدون افزایش قابل توجه منابع آموزشی برطرف می‌کند – آموزش یک مدل AlphaGenome واحد (بدون تقطیر) چهار ساعت طول کشید و به نیمی از بودجه محاسباتی مورد استفاده برای آموزش مدل اصلی Enformer ما نیاز داشت.

پیش‌بینی جامع چندوجهی

با باز کردن قفل پیش‌بینی با وضوح بالا برای توالی‌های ورودی طولانی، AlphaGenome می‌تواند طیف متنوعی از روش‌ها را پیش‌بینی کند. با انجام این کار، AlphaGenome اطلاعات جامع‌تری در مورد مراحل پیچیده تنظیم ژن در اختیار دانشمندان قرار می‌دهد.

امتیازدهی کارآمد انواع مختلف

علاوه بر پیش‌بینی طیف متنوعی از خواص مولکولی، AlphaGenome می‌تواند به طور موثر تأثیر یک گونه ژنتیکی را بر روی تمام این خواص در یک ثانیه امتیازدهی کند. این کار را با مقایسه پیش‌بینی‌های توالی‌های جهش‌یافته با توالی‌های جهش‌نیافته و خلاصه‌سازی موثر این مقایسه با استفاده از رویکردهای مختلف برای روش‌های مختلف انجام می‌دهد.

مدل‌سازی نوین اتصال-اتصال

بسیاری از بیماری‌های ژنتیکی نادر، مانند آتروفی عضلانی نخاعی و برخی از انواع فیبروز کیستیک، می‌توانند ناشی از خطا در پیرایش RNA باشند – فرآیندی که در آن بخش‌هایی از مولکول RNA حذف یا “قطعه قطعه” می‌شوند و انتهای باقی مانده دوباره به هم متصل می‌شوند. برای اولین بار، AlphaGenome می‌تواند به طور صریح محل و سطح بیان این اتصالات را مستقیماً از توالی مدل‌سازی کند و بینش عمیق‌تری در مورد پیامدهای انواع ژنتیکی بر پیرایش RNA ارائه دهد.

عملکرد بی‌نظیر در بنچمارک‌ها

آلفاژنوم در طیف گسترده‌ای از معیارهای پیش‌بینی ژنومی، مانند پیش‌بینی اینکه کدام بخش‌های مولکول DNA در مجاورت یکدیگر قرار خواهند گرفت، اینکه آیا یک گونه ژنتیکی بیان یک ژن را افزایش یا کاهش می‌دهد، یا اینکه آیا الگوی پیرایش ژن را تغییر می‌دهد، به عملکرد پیشرفته‌ای دست می‌یابد.

نمودار میله‌ای که پیشرفت‌های نسبی AlphaGenome را در وظایف توالی DNA انتخاب‌شده و اثرات متغیر نشان می‌دهد، در مقایسه با نتایج بهترین روش‌های فعلی در هر دسته.

هنگام تولید پیش‌بینی برای توالی‌های DNA منفرد، AlphaGenome در ۲۲ مورد از ۲۴ ارزیابی، عملکرد بهتری نسبت به بهترین مدل‌های خارجی داشت. و هنگام پیش‌بینی اثر تنظیمی یک واریانت، در ۲۴ مورد از ۲۶ ارزیابی، با مدل‌های خارجی برتر مطابقت داشت یا از آنها پیشی گرفت.

این مقایسه شامل مدل‌هایی بود که برای وظایف فردی تخصص یافته بودند. AlphaGenome تنها مدلی بود که می‌توانست به طور مشترک تمام روش‌های ارزیابی شده را پیش‌بینی کند، که این امر بر عمومیت آن تأکید دارد. برای اطلاعات بیشتر به نسخه پیش‌نویس ما مراجعه کنید .

مزایای یک مدل یکپارچه

عمومیت AlphaGenome به دانشمندان این امکان را می‌دهد که با یک فراخوانی API، تأثیر یک متغیر را بر روی تعدادی از روش‌ها به طور همزمان بررسی کنند. این بدان معناست که دانشمندان می‌توانند بدون نیاز به استفاده از چندین مدل برای بررسی روش‌های مختلف، فرضیه‌ها را سریع‌تر تولید و آزمایش کنند.

علاوه بر این، عملکرد قوی AlphaGenome نشان می‌دهد که این مدل، نمایش نسبتاً کلی از توالی DNA را در زمینه تنظیم ژن آموخته است. این امر، آن را به پایه‌ای قوی برای جامعه گسترده‌تر تبدیل می‌کند تا بر اساس آن، کار خود را پیش ببرند. پس از انتشار کامل مدل، دانشمندان قادر خواهند بود آن را با مجموعه داده‌های خود تطبیق داده و تنظیم کنند تا به سوالات تحقیقاتی منحصر به فرد خود بهتر پاسخ دهند.

در نهایت، این رویکرد یک معماری انعطاف‌پذیر و مقیاس‌پذیر برای آینده فراهم می‌کند. با گسترش داده‌های آموزشی، قابلیت‌های AlphaGenome می‌تواند برای عملکرد بهتر، پوشش گونه‌های بیشتر یا گنجاندن روش‌های اضافی برای جامع‌تر کردن مدل، گسترش یابد.

این یک نقطه عطف برای این حوزه است. برای اولین بار، ما یک مدل واحد داریم که زمینه دوربرد، دقت سطح پایه و عملکرد پیشرفته را در طیف وسیعی از وظایف ژنومی یکپارچه می‌کند.

دکتر کالب لارو، مرکز سرطان مموریال اسلون-کترینگ

یک ابزار تحقیقاتی قدرتمند

قابلیت‌های پیش‌بینی آلفاژنوم می‌تواند به چندین مسیر تحقیقاتی کمک کند:

  1. درک بیماری: با پیش‌بینی دقیق‌تر اختلالات ژنتیکی، AlphaGenome می‌تواند به محققان کمک کند تا علل بالقوه بیماری را دقیق‌تر مشخص کنند و تأثیر عملکردی گونه‌های مرتبط با صفات خاص را بهتر تفسیر کنند و به طور بالقوه اهداف درمانی جدیدی را کشف کنند. ما فکر می‌کنیم که این مدل به ویژه برای مطالعه گونه‌های نادر با اثرات بالقوه بزرگ، مانند آن‌هایی که باعث اختلالات نادر مندلی می‌شوند، مناسب است.
  2. زیست‌شناسی مصنوعی: پیش‌بینی‌های آن می‌تواند برای هدایت طراحی DNA مصنوعی با عملکرد تنظیمی خاص مورد استفاده قرار گیرد – برای مثال، فقط فعال کردن یک ژن در سلول‌های عصبی اما نه سلول‌های ماهیچه‌ای.
  3. تحقیقات بنیادی: این می‌تواند با کمک به نقشه‌برداری از عناصر عملکردی حیاتی ژنوم و تعریف نقش‌های آنها، درک ما از ژنوم را تسریع کند و ضروری‌ترین دستورالعمل‌های DNA را برای تنظیم عملکرد یک نوع سلول خاص شناسایی کند.

برای مثال، ما از AlphaGenome برای بررسی مکانیسم بالقوه یک جهش مرتبط با سرطان استفاده کردیم. در یک مطالعه موجود روی بیماران مبتلا به لوسمی لنفوبلاستیک حاد سلول T (T-ALL) ، محققان جهش‌هایی را در مکان‌های خاصی از ژنوم مشاهده کردند. با استفاده از AlphaGenome، ما پیش‌بینی کردیم که جهش‌ها با معرفی یک موتیف اتصال MYB DNA، ژن مجاور به نام TAL1 را فعال می‌کنند که مکانیسم شناخته شده بیماری را تکرار می‌کند و توانایی AlphaGenome را در پیوند دادن انواع غیر کدکننده خاص به ژن‌های بیماری برجسته می‌کند.

آلفاژنوم ابزاری قدرتمند برای این حوزه خواهد بود. تعیین ارتباط انواع مختلف غیرکدکننده می‌تواند بسیار چالش‌برانگیز باشد، به‌ویژه در مقیاس بزرگ. این ابزار قطعه‌ای حیاتی از پازل را فراهم می‌کند و به ما امکان می‌دهد ارتباطات بهتری برای درک بیماری‌هایی مانند سرطان برقرار کنیم.

پروفسور مارک منصور، دانشگاه کالج لندن

محدودیت‌های فعلی

آلفاژنوم گامی مهم به جلو است، اما مهم است که محدودیت‌های فعلی آن را نیز بپذیریم.

مانند سایر مدل‌های مبتنی بر توالی، ثبت دقیق تأثیر عناصر تنظیمی بسیار دور، مانند آن‌هایی که بیش از ۱۰۰۰۰۰ حرف DNA از ما فاصله دارند، هنوز یک چالش مداوم است. اولویت دیگر برای کارهای آینده، افزایش بیشتر توانایی مدل در ثبت الگوهای خاص سلول و بافت است.

ما AlphaGenome را برای پیش‌بینی ژنوم شخصی، که یک چالش شناخته‌شده برای مدل‌های هوش مصنوعی است، طراحی یا اعتبارسنجی نکرده‌ایم. در عوض، ما بیشتر بر توصیف عملکرد روی انواع ژنتیکی فردی تمرکز کرده‌ایم. و اگرچه AlphaGenome می‌تواند نتایج مولکولی را پیش‌بینی کند، اما تصویر کاملی از چگونگی منجر شدن تغییرات ژنتیکی به صفات یا بیماری‌های پیچیده ارائه نمی‌دهد. این موارد اغلب شامل فرآیندهای بیولوژیکی گسترده‌تری مانند عوامل رشدی و محیطی هستند که فراتر از محدوده مستقیم مدل ما هستند.

ما همچنان به بهبود مدل‌های خود و جمع‌آوری بازخوردها ادامه می‌دهیم تا به ما در رفع این شکاف‌ها کمک کنیم.

فعال کردن جامعه برای آزادسازی پتانسیل AlphaGenome

AlphaGenome اکنون برای استفاده غیرتجاری از طریق API AlphaGenome ما در دسترس است . لطفاً توجه داشته باشید که پیش‌بینی‌های مدل ما فقط برای استفاده تحقیقاتی در نظر گرفته شده و برای اهداف بالینی مستقیم طراحی یا اعتبارسنجی نشده‌اند.

از محققان در سراسر جهان دعوت می‌شود تا با موارد استفاده بالقوه AlphaGenome تماس بگیرند و از طریق انجمن انجمن، سوالات خود را مطرح کنند یا بازخورد خود را به اشتراک بگذارند .

ما امیدواریم که AlphaGenome ابزاری مهم برای درک بهتر ژنوم باشد و ما متعهد به همکاری با متخصصان خارجی در دانشگاه‌ها، صنعت و سازمان‌های دولتی هستیم تا اطمینان حاصل کنیم که AlphaGenome تا حد امکان به نفع افراد بیشتری باشد.

ما امیدواریم که این پژوهش، همراه با تلاش‌های جمعی جامعه علمی گسترده‌تر، درک ما را از فرآیندهای پیچیده سلولی کدگذاری شده در توالی DNA و اثرات گونه‌ها عمیق‌تر کند و اکتشافات جدید و هیجان‌انگیزی را در ژنومیک و مراقبت‌های بهداشتی به ارمغان بیاورد.

فهرست مطالب

پیمایش به بالا