چکیده
انگیزه: فعل و انفعالات پروتئین به ما در درک ارتباط عملکردی ژن ها و نقش آنها در تعیین فنوتیپ کمک می کند. آزمایشهای موجود، اطلاعات «مرجع» ناقصی را درباره زیرمجموعه محدودی از تعاملات بالقوه در یک زمینه بیولوژیکی خاص ارائه میکنند که میتوان آنها را از طریق روشهای یادگیری ماشین به کل ژنوم در زمینههای مختلف همچون بافتها یا گونههای دیگر تعمیم داد. با این حال، ارزیابی عملکرد این روشها همچنان یک چالش مهم محسوب می شود. پیشنهاد ما در این مقاله، ارزیابی تعمیمپذیری خصوصیات ژن از طریق شکل منحنی عملکردی آنها می باشد.
نتایج: در پژوهش حاضر، ما کلاس های هم ارزی عملکردی (FECs)- زیر مجموعهای از ژنهای حاشیه نویسی شده و بدون حاشیهنویسی که مشترکاً به هدایت عملکردها می پردازند- را با بررسی وجود خطوط مستقیم در منحنیهای ROC که حاصل پیشبینی های ژن محور، مانند پیشبینی عملکرد یا تعامل هستند، شناسایی می نماییم. FEC ها در انواع داده ها و روش ها بطور گسترده وجود داشته که می توان از آنها برای ارزیابی میزان و ویژگی زمینه ای حاشیه نویسی های عملکردی به روشی داده محور استفاده نمود. برای مثال، FEC ها نشان می دهند که نشانگرهای سلول B را می توان به نشانگرهای اولیه مشترک (10-50 ژن) و نشانگرهای ثانویه بافتی (100-500 ژن) تفکیک نمود. علاوه بر این، FEC ها وجود ماژولهای کاربردی را پیشنهاد میکنند که طیف وسیعی از ژنوم را با مجموعههای نشانگرهایی که حداکثر 5 درصد از ژنوم را در بر گرفته و تعمیم های داده محور مجموعههای هستیشناسی ژن که 40 درصد از ژنوم را پوشش میدهند. به منظور ارزیابی بصری و آماری ساده، شناسایی FECها در منحنیهای عملکردی راه را برای توصیف عملکردهای جدید و افزایش استحکام در تعریف مجموعههای ژن عملکردی هموار خواهد ساخت.
1-مقدمه
مشخص کردن ویژگی های عملکردی ژن ها در طیفی از شرایط، گونه ها و سایر اختلالات یک چالش اساسی در زیست شناسی پس ژنوم محسوب می شود. با افزایش اندازه و پیچیدگی مجموعه داده ها، استفاده از روشهای یادگیری ماشین و تحقیقات هوش مصنوعی برای تجزیه مجموعه دادههای گسترده برای سیگنالهای همگرای دقیق ارزشمندتر شده است....