معرفی یک مدل توالی DNA جدید و یکپارچه که پیشبینی اثر انواع تنظیمی را پیش میبرد و نویدبخش روشن شدن عملکرد ژنوم است – اکنون از طریق API در دسترس است.
ژنوم، دفترچه راهنمای سلولی ماست. این مجموعه کامل DNA است که تقریباً هر بخش از یک موجود زنده را از ظاهر و عملکرد گرفته تا رشد و تولید مثل هدایت میکند. تغییرات کوچک در توالی DNA یک ژنوم میتواند پاسخ یک موجود زنده به محیط یا حساسیت آن به بیماری را تغییر دهد. اما رمزگشایی نحوه خواندن دستورالعملهای ژنوم در سطح مولکولی – و اینکه وقتی یک تغییر کوچک DNA رخ میدهد چه اتفاقی میافتد – هنوز یکی از بزرگترین اسرار زیستشناسی است.
امروز، ما AlphaGenome را معرفی میکنیم ، یک ابزار جدید هوش مصنوعی (AI) که به طور جامعتر و دقیقتری پیشبینی میکند که چگونه انواع یا جهشهای تکی در توالیهای DNA انسان بر طیف وسیعی از فرآیندهای بیولوژیکی تنظیمکننده ژنها تأثیر میگذارند. این امر، در کنار عوامل دیگر، با پیشرفتهای فنی امکانپذیر شده است که به مدل اجازه میدهد توالیهای طولانی DNA را پردازش کند و پیشبینیهای با وضوح بالا ارائه دهد.
برای پیشبرد تحقیقات علمی، ما AlphaGenome را از طریق API AlphaGenome خود برای تحقیقات غیرتجاری به صورت پیشنمایش در دسترس قرار میدهیم و قصد داریم این مدل را در آینده منتشر کنیم.
ما معتقدیم که آلفاژنوم میتواند منبع ارزشمندی برای جامعه علمی باشد و به دانشمندان کمک کند تا عملکرد ژنوم، زیستشناسی بیماریها را بهتر درک کنند و در نهایت، اکتشافات بیولوژیکی جدید و توسعه درمانهای جدید را هدایت کنند.
نحوه کار آلفاژنوم
مدل AlphaGenome ما یک توالی DNA طولانی – تا ۱ میلیون حرف، که به عنوان جفت باز نیز شناخته میشود – را به عنوان ورودی دریافت میکند و هزاران ویژگی مولکولی را که فعالیت تنظیمی آن را توصیف میکنند، پیشبینی میکند. همچنین میتواند با مقایسه پیشبینیهای توالیهای جهشیافته با توالیهای جهشنیافته، اثرات انواع یا جهشهای ژنتیکی را امتیازدهی کند.
ویژگیهای پیشبینیشده شامل محل شروع و پایان ژنها در انواع سلولها و بافتهای مختلف، محل پیرایش آنها، میزان RNA تولید شده و همچنین بازهای DNA قابل دسترسی، نزدیک به یکدیگر یا متصل به پروتئینهای خاص است. دادههای آموزشی از کنسرسیومهای عمومی بزرگی از جمله ENCODE ، GTEx ، 4D Nucleome و FANTOM5 تهیه شده است که به صورت تجربی این ویژگیها را که شامل روشهای مهم تنظیم ژن در صدها نوع سلول و بافت انسان و موش است، اندازهگیری کردهاند.
معماری AlphaGenome از لایههای کانولوشن برای تشخیص اولیه الگوهای کوتاه در توالی ژنوم، از مبدلها برای انتقال اطلاعات در تمام موقعیتهای توالی و از یک سری لایههای نهایی برای تبدیل الگوهای شناسایی شده به پیشبینیهایی برای روشهای مختلف استفاده میکند. در طول آموزش، این محاسبه در چندین واحد پردازش تنسور (TPU) به هم پیوسته برای یک توالی واحد توزیع میشود.
این مدل بر اساس مدل ژنومیک قبلی ما، Enformer، ساخته شده و مکمل AlphaMissense است که در دستهبندی اثرات گونهها در مناطق کدکننده پروتئین تخصص دارد. این مناطق 2٪ از ژنوم را پوشش میدهند. 98٪ باقیمانده که مناطق غیر کدکننده نامیده میشوند، برای هماهنگسازی فعالیت ژن بسیار مهم هستند و شامل گونههای زیادی مرتبط با بیماریها میباشند. AlphaGenome دیدگاه جدیدی برای تفسیر این توالیهای گسترده و گونههای درون آنها ارائه میدهد.
ویژگیهای متمایز AlphaGenome
آلفاژنوم در مقایسه با مدلهای توالی DNA موجود، چندین ویژگی متمایز ارائه میدهد:
توالی-زمینه طولانی با وضوح بالا
مدل ما تا ۱ میلیون حرف DNA را تجزیه و تحلیل میکند و پیشبینیهایی را با وضوح حروف منفرد انجام میدهد. زمینه توالی طولانی برای پوشش مناطق تنظیمکننده ژنها از دوردست مهم است و وضوح پایه برای ثبت جزئیات بیولوژیکی دقیق مهم است.
مدلهای قبلی مجبور بودند بین طول توالی و وضوح تعادل برقرار کنند، که این امر طیف روشهایی را که میتوانستند به طور مشترک مدلسازی و پیشبینی دقیق کنند، محدود میکرد. پیشرفتهای فنی ما این محدودیت را بدون افزایش قابل توجه منابع آموزشی برطرف میکند – آموزش یک مدل AlphaGenome واحد (بدون تقطیر) چهار ساعت طول کشید و به نیمی از بودجه محاسباتی مورد استفاده برای آموزش مدل اصلی Enformer ما نیاز داشت.
پیشبینی جامع چندوجهی
با باز کردن قفل پیشبینی با وضوح بالا برای توالیهای ورودی طولانی، AlphaGenome میتواند طیف متنوعی از روشها را پیشبینی کند. با انجام این کار، AlphaGenome اطلاعات جامعتری در مورد مراحل پیچیده تنظیم ژن در اختیار دانشمندان قرار میدهد.
امتیازدهی کارآمد انواع مختلف
علاوه بر پیشبینی طیف متنوعی از خواص مولکولی، AlphaGenome میتواند به طور موثر تأثیر یک گونه ژنتیکی را بر روی تمام این خواص در یک ثانیه امتیازدهی کند. این کار را با مقایسه پیشبینیهای توالیهای جهشیافته با توالیهای جهشنیافته و خلاصهسازی موثر این مقایسه با استفاده از رویکردهای مختلف برای روشهای مختلف انجام میدهد.
مدلسازی نوین اتصال-اتصال
بسیاری از بیماریهای ژنتیکی نادر، مانند آتروفی عضلانی نخاعی و برخی از انواع فیبروز کیستیک، میتوانند ناشی از خطا در پیرایش RNA باشند – فرآیندی که در آن بخشهایی از مولکول RNA حذف یا “قطعه قطعه” میشوند و انتهای باقی مانده دوباره به هم متصل میشوند. برای اولین بار، AlphaGenome میتواند به طور صریح محل و سطح بیان این اتصالات را مستقیماً از توالی مدلسازی کند و بینش عمیقتری در مورد پیامدهای انواع ژنتیکی بر پیرایش RNA ارائه دهد.
عملکرد بینظیر در بنچمارکها
آلفاژنوم در طیف گستردهای از معیارهای پیشبینی ژنومی، مانند پیشبینی اینکه کدام بخشهای مولکول DNA در مجاورت یکدیگر قرار خواهند گرفت، اینکه آیا یک گونه ژنتیکی بیان یک ژن را افزایش یا کاهش میدهد، یا اینکه آیا الگوی پیرایش ژن را تغییر میدهد، به عملکرد پیشرفتهای دست مییابد.
نمودار میلهای که پیشرفتهای نسبی AlphaGenome را در وظایف توالی DNA انتخابشده و اثرات متغیر نشان میدهد، در مقایسه با نتایج بهترین روشهای فعلی در هر دسته.
هنگام تولید پیشبینی برای توالیهای DNA منفرد، AlphaGenome در ۲۲ مورد از ۲۴ ارزیابی، عملکرد بهتری نسبت به بهترین مدلهای خارجی داشت. و هنگام پیشبینی اثر تنظیمی یک واریانت، در ۲۴ مورد از ۲۶ ارزیابی، با مدلهای خارجی برتر مطابقت داشت یا از آنها پیشی گرفت.
این مقایسه شامل مدلهایی بود که برای وظایف فردی تخصص یافته بودند. AlphaGenome تنها مدلی بود که میتوانست به طور مشترک تمام روشهای ارزیابی شده را پیشبینی کند، که این امر بر عمومیت آن تأکید دارد. برای اطلاعات بیشتر به نسخه پیشنویس ما مراجعه کنید .
مزایای یک مدل یکپارچه
عمومیت AlphaGenome به دانشمندان این امکان را میدهد که با یک فراخوانی API، تأثیر یک متغیر را بر روی تعدادی از روشها به طور همزمان بررسی کنند. این بدان معناست که دانشمندان میتوانند بدون نیاز به استفاده از چندین مدل برای بررسی روشهای مختلف، فرضیهها را سریعتر تولید و آزمایش کنند.
علاوه بر این، عملکرد قوی AlphaGenome نشان میدهد که این مدل، نمایش نسبتاً کلی از توالی DNA را در زمینه تنظیم ژن آموخته است. این امر، آن را به پایهای قوی برای جامعه گستردهتر تبدیل میکند تا بر اساس آن، کار خود را پیش ببرند. پس از انتشار کامل مدل، دانشمندان قادر خواهند بود آن را با مجموعه دادههای خود تطبیق داده و تنظیم کنند تا به سوالات تحقیقاتی منحصر به فرد خود بهتر پاسخ دهند.
در نهایت، این رویکرد یک معماری انعطافپذیر و مقیاسپذیر برای آینده فراهم میکند. با گسترش دادههای آموزشی، قابلیتهای AlphaGenome میتواند برای عملکرد بهتر، پوشش گونههای بیشتر یا گنجاندن روشهای اضافی برای جامعتر کردن مدل، گسترش یابد.
«این یک نقطه عطف برای این حوزه است. برای اولین بار، ما یک مدل واحد داریم که زمینه دوربرد، دقت سطح پایه و عملکرد پیشرفته را در طیف وسیعی از وظایف ژنومی یکپارچه میکند.
دکتر کالب لارو، مرکز سرطان مموریال اسلون-کترینگ
یک ابزار تحقیقاتی قدرتمند
قابلیتهای پیشبینی آلفاژنوم میتواند به چندین مسیر تحقیقاتی کمک کند:
- درک بیماری: با پیشبینی دقیقتر اختلالات ژنتیکی، AlphaGenome میتواند به محققان کمک کند تا علل بالقوه بیماری را دقیقتر مشخص کنند و تأثیر عملکردی گونههای مرتبط با صفات خاص را بهتر تفسیر کنند و به طور بالقوه اهداف درمانی جدیدی را کشف کنند. ما فکر میکنیم که این مدل به ویژه برای مطالعه گونههای نادر با اثرات بالقوه بزرگ، مانند آنهایی که باعث اختلالات نادر مندلی میشوند، مناسب است.
- زیستشناسی مصنوعی: پیشبینیهای آن میتواند برای هدایت طراحی DNA مصنوعی با عملکرد تنظیمی خاص مورد استفاده قرار گیرد – برای مثال، فقط فعال کردن یک ژن در سلولهای عصبی اما نه سلولهای ماهیچهای.
- تحقیقات بنیادی: این میتواند با کمک به نقشهبرداری از عناصر عملکردی حیاتی ژنوم و تعریف نقشهای آنها، درک ما از ژنوم را تسریع کند و ضروریترین دستورالعملهای DNA را برای تنظیم عملکرد یک نوع سلول خاص شناسایی کند.
برای مثال، ما از AlphaGenome برای بررسی مکانیسم بالقوه یک جهش مرتبط با سرطان استفاده کردیم. در یک مطالعه موجود روی بیماران مبتلا به لوسمی لنفوبلاستیک حاد سلول T (T-ALL) ، محققان جهشهایی را در مکانهای خاصی از ژنوم مشاهده کردند. با استفاده از AlphaGenome، ما پیشبینی کردیم که جهشها با معرفی یک موتیف اتصال MYB DNA، ژن مجاور به نام TAL1 را فعال میکنند که مکانیسم شناخته شده بیماری را تکرار میکند و توانایی AlphaGenome را در پیوند دادن انواع غیر کدکننده خاص به ژنهای بیماری برجسته میکند.
«آلفاژنوم ابزاری قدرتمند برای این حوزه خواهد بود. تعیین ارتباط انواع مختلف غیرکدکننده میتواند بسیار چالشبرانگیز باشد، بهویژه در مقیاس بزرگ. این ابزار قطعهای حیاتی از پازل را فراهم میکند و به ما امکان میدهد ارتباطات بهتری برای درک بیماریهایی مانند سرطان برقرار کنیم.
پروفسور مارک منصور، دانشگاه کالج لندن
محدودیتهای فعلی
آلفاژنوم گامی مهم به جلو است، اما مهم است که محدودیتهای فعلی آن را نیز بپذیریم.
مانند سایر مدلهای مبتنی بر توالی، ثبت دقیق تأثیر عناصر تنظیمی بسیار دور، مانند آنهایی که بیش از ۱۰۰۰۰۰ حرف DNA از ما فاصله دارند، هنوز یک چالش مداوم است. اولویت دیگر برای کارهای آینده، افزایش بیشتر توانایی مدل در ثبت الگوهای خاص سلول و بافت است.
ما AlphaGenome را برای پیشبینی ژنوم شخصی، که یک چالش شناختهشده برای مدلهای هوش مصنوعی است، طراحی یا اعتبارسنجی نکردهایم. در عوض، ما بیشتر بر توصیف عملکرد روی انواع ژنتیکی فردی تمرکز کردهایم. و اگرچه AlphaGenome میتواند نتایج مولکولی را پیشبینی کند، اما تصویر کاملی از چگونگی منجر شدن تغییرات ژنتیکی به صفات یا بیماریهای پیچیده ارائه نمیدهد. این موارد اغلب شامل فرآیندهای بیولوژیکی گستردهتری مانند عوامل رشدی و محیطی هستند که فراتر از محدوده مستقیم مدل ما هستند.
ما همچنان به بهبود مدلهای خود و جمعآوری بازخوردها ادامه میدهیم تا به ما در رفع این شکافها کمک کنیم.
فعال کردن جامعه برای آزادسازی پتانسیل AlphaGenome
AlphaGenome اکنون برای استفاده غیرتجاری از طریق API AlphaGenome ما در دسترس است . لطفاً توجه داشته باشید که پیشبینیهای مدل ما فقط برای استفاده تحقیقاتی در نظر گرفته شده و برای اهداف بالینی مستقیم طراحی یا اعتبارسنجی نشدهاند.
از محققان در سراسر جهان دعوت میشود تا با موارد استفاده بالقوه AlphaGenome تماس بگیرند و از طریق انجمن انجمن، سوالات خود را مطرح کنند یا بازخورد خود را به اشتراک بگذارند .
ما امیدواریم که AlphaGenome ابزاری مهم برای درک بهتر ژنوم باشد و ما متعهد به همکاری با متخصصان خارجی در دانشگاهها، صنعت و سازمانهای دولتی هستیم تا اطمینان حاصل کنیم که AlphaGenome تا حد امکان به نفع افراد بیشتری باشد.
ما امیدواریم که این پژوهش، همراه با تلاشهای جمعی جامعه علمی گستردهتر، درک ما را از فرآیندهای پیچیده سلولی کدگذاری شده در توالی DNA و اثرات گونهها عمیقتر کند و اکتشافات جدید و هیجانانگیزی را در ژنومیک و مراقبتهای بهداشتی به ارمغان بیاورد.