B i o i n f o r m a t i c s - โลกของ Bioinformatics เราทำอะไรบ้าง
มาที่บทความ ที่ควรจะเป็นบทความแรกใน Series นี้เลย หลาย ๆ คนอาจจะสงสัยว่า โลกของ Bioinformatics เราทำอะไรกับมันบ้าง เราอาจจะพอรู้จากของ Genomics ที่เราคุยกันในส่วนของพวก DNA อะไรพวกนั้น แต่จริง ๆ แล้ว Bioinformatics มันมีอะไรเยอะกว่านั้นเยอะมาก ๆ
ปล. ตั้งชื่อ Series ได้ เ ก เ ร มาก ๆ แต่ไม่ได้เกเรกับคนนะ เ ก เ ร กับพวก Search Engine นี่แหละ !
B i o i n f o r m a t i c s
เพื่อให้เข้าใจได้ง่ายขึ้นว่า Bioinformatics เราทำอะไรบ้าง เราต้องทำความเข้าใจก่อนว่า Bioinformatics คืออะไร ?
คำว่า Bioinformatics มันเกิดจากคำ 2 คำคือคำว่า Bio- ที่มาจากคำว่า Biology และ -informatics ที่มาจากคำว่า Information ทำให้ใน Bioinformatics มันเลยเป็นสาขาที่เรียกว่าเป็นลูกครึ่ง ของทั้ง Biology และ Information Technology เข้าด้วยกัน เกิดเป็นโกโก้ @#$##$ ผิด ๆ ท่ด ๆ เขาไม่ได้จ่าย
ถ้าเราพูดถึง Information Technology เราจะพูดถึงขั้นตอนต่าง ๆ ในการจัดการข้อมูล ตั้งแต่การเก็บ (Storing), การดึงข้อมูล (Retreiving) และ การวิเคราะห์ (Analyse) ข้อมูล ดังนั้น Bioinfomatics ที่เกิดจากคำว่า Biology และ Information เลยเป็นศาสตร์ที่เราจะจัดการข้อมูล จัดเก็บ ดึงข้อมูล และ วิเคราะห์ข้อมูลทางชีวภาพนั่นเอง
เท่าที่ไปอ่านมานานมาละ ตั้งแต่มาเรียนแรก ๆ คำ ๆ นี้ ไม่ได้พึ่งเกิดขึ้นเมื่อไม่กี่ปีนี้นะ แต่มันเกิดขึ้นมานานมาก ๆ แล้ว แต่มีช่วงหลัง ๆ เราเดาว่า น่าจะหลังจาก Human Genome Project (HGP) เริ่ม Publicise Dataset ออกมาไม่นาน คนน่าจะสนใจเรื่องนี้กันมาก ๆ เลยทำให้มันบูมขึ้นมาเยอะมาก จนตอนนี้แมร่งอยู่ทุกที่ ลามไปกันหมด ผมจะทำ Bioinformatics เหมือนผมจะทำ AI ในฝั่งคอมพิวเตอร์ (ถามว่าจะทำอะไร ตอบไม่ได้ซะงั้น อีบ้า !!! อยากจะโยกหน้าคนพวกนี้สักที ! ไว้จะมาด่าคนจำพวกนี้ในโอกาสหน้า)
ข้อมูลทางชีวภาพ (Biological Data)
เราไม่แน่ใจเหมือนกันนะว่า เราใช้คำถูกมั้ย คำว่า ข้อมูลทางชีวภาพเนี่ย เราจะหมายถึง Biological Data ในภาษาอังกฤษ หวังว่าจะถูกนะ
อ่าน ๆ มาแล้วก็น่าจะเอ๊ะ... แน่ ๆ ว่า แล้ว Biological Data นี่มันหน้าตาเป็นอย่างไร หรือมันมีอะไรกันบ้าง เพื่อให้เข้าใจเรื่องนี้ได้ง่ายขึ้น เราจะพาทุกคนย้อนกลับไปเรียนมัธยมปลายกันดีกว่า
เราน่าจะเคยเรียนผ่านหูมาบ้างแล้วละว่า DNA มันเหมือนกับแม่พิมพ์ของสิ่งมีชีวิต เพราะร่างกายเราสามารถที่จะ Replicate มันได้ และ ยังใช้เป็นเหมือนพิมพ์เขียวตั้งต้นในการสร้างสารต่าง ๆ ออกมา ทำให้ข้อมูลแรกที่เราจะพูดถึงก็คือ พวก ลำดับ DNA ของเรานั่นเอง พวกนี้เราสามารถนำไปใช้ในการศึกษาได้เยอะมาก ๆ โดยเฉพาะพวกฝั่งของ Genomics เราอาจจะเอามาตอบคำถามพวกเรื่องของเชื้อชาติได้จนไปถึง มะเร็ง กันเลย
ต่อมา เราก็จะเอา DNA ของเราไปแปลง ลอกมาเฉพาะบางส่วนเพื่อเอามาเป็นแม่พิมพ์ในการสร้าง Protein เราเรียก Process นี้ว่าการทำ Transcription ข้อมูลก็อาจจะเป็นส่วนไหนของ DNA ที่ถูกเอามาทำขั้นตอนนี้บ้างละ แล้วมันมีผลต่อการแสดงออกอย่างไร มันก็จะมีการศึกษาเรื่องพวกนี้อยู่ เราเรียกมันว่า Transcriptomic นั่นเอง
จนสุดท้าย เราได้ Protein ออกมา ถามว่า มันหน้าตาเป็นอย่างไร มันมีการพับไปพับมาอย่างไรบ้าง แล้วลักษณะของมันทำอะไรได้ ความแตกต่างกันนิดหน่อย ทำให้มีผลอะไรบ้าง อาจจะออกมาเป็นพวก ลำดับของ Protein หรือพวก โครงสร้าง 3D ของ Protein พวกนั้น มักจะใช้ในการศึกษาในพวก Proteomic
จะเห็นได้ว่า เรามีการศึกษาในทุก ๆ ขั้นตอนใน Central Dogma กันไปเลย นอกจากนั้น เรายังไม่ได้ Cover ไปถึงพวกในระดับสิ่งแวดล้อมและประชากร อะไรอีกมากมาย เราจะเห็นว่า เรามีข้อมูลทางชีวภาพมากมาย ยิ่งในปัจจุบัน การเข้าถึงพวกเครื่องมือต่าง ๆ ในการสร้างข้อมูลพวกนี้ก็ค่อย ๆ ถูกลงไปมาก
เรายกตัวอย่างพวก การถอดรหัส DNA (DNA Sequencing) เมื่อก่อนการ Sequence DNA ของคนสักหนึ่งคนอาจจะต้องใช้เงินหลักล้าน USD เลย แต่ตอนน้ีเรากำลังคุยกันอยู่ที่หลักพันถึงหมื่นเท่านั้นเอง นั่นแปลว่า ข้อมูลพวกนี้มันก็จะมีมากขึ้นเรื่อย ๆ ทำให้ การจัดการข้อมูล การทำงานกับข้อมูลพวกนี้เลยเป็นเรื่องสำคัญมาก ๆ และสำคัญกว่านั้นคือ แล้วข้อมูลที่ได้มา เราจะวิเคราะห์มันได้อย่างไรละ นั่นก็เป็นอีกปัญหานึง
เราเอาข้อมูลพวกนี้ไปทำอะไรบ้าง ?
ข้อมูลมันมีเยอะแยะมากมายมาก ๆ โดยเฉพาะในยุคของข้อมูลขนาดนี้ หลาย ๆ คนบอกว่า Data is the new gold หรือ ข้อมูลก็คือทองในยุคนี้นั่นเอง เอาจริง ๆ มันก็จริง Biological Data ก็เช่นกัน เราเอามาศึกษาวิจัยเยอะมาก ๆ
ตัวอย่างที่เราอยากจะกำหมัดมาก ๆ แต่แมร่งก็เสือกใช้คือ พวกที่ตรวจพรสวรรค์จาก DNA พวกนั้น ก็อาศัยข้อมูลนี่แหละว่าคนที่มีลักษณะแบบนี้ น่าจะมี Variation (การเปลี่ยนแปลง) หรือก็คือ แต่ละคนก็จะมีบางจุดในลำดับ DNA ที่แตกต่างกัน ตัวอย่างเช่น ถ้านักวิ่ง หรือคนที่วิ่งเก่ง ๆ เขามีความเปลี่ยนแปลงตรงนี้ และ เราเอาไปหักลบกับคนทั่ว ๆ ไป ความเปลี่ยนแปลงที่เหลือนี่แหละ อาจจะเป็น Key ที่ ช่วยให้ เสริมความสามารถในด้านนั้น ๆ อะไรแบบนั้น จะเห็นว่า เขาใช้ข้อมูล DNA มาเพื่อทำนาย พวกเรื่องความถนัดอะไรพวกนั้นก็มี
หรืออีกอันที่ หาทำ พอ ๆ กัน ก็น่าจะเป็นอันไปที่บอกว่า เราเป็นญาติกับใครอะไรนี่แหละ ที่เราจะไปซื้อ Kit มาเขี่ย ๆ เก็บตัวอย่าง DNA เราแล้วส่งไป Lab แล้วเขาจะบอกมาได้เลยว่า เรามีเชื้อสายอะไรบ้าง เป็นญาติกับดาราคนไหน นั่นก็อาศัยข้อมูลจาก DNA ของ เราเอง และคนจำนวนมาก ๆ มาหาความสัมพันธ์กัน
เอาอันที่เราไม่กำหมัด และคิดว่ามีประโยชน์กันดีกว่า ตอน COVID-19 ระบาดใหม่ ๆ นักวิทยาศาสตร์เองก็ไม่ได้มีข้อมูลอะไรเกี่ยวกับมันมากเท่าไหร่ หนึ่งในเรื่องที่เราอยากจะรู้คือ COVID-19 มันหลบระบบภูมิคุ้มกันเราไปได้อย่างไร มันใช้ Protein อะไรที่ทำเรื่องนั้นได้ ที่สำคัญคือ มันหน้าตาอย่างไร ถ้าเรารู้ว่า มันมีโครงสร้าง มันมีหน้าตาอย่างไร ก็อาจจะทำให้เราสามารถออกแบบยาออกมาที่ Fit เข้ากับโครงสร้างของไวรัส เพื่อจัดการมันได้นั่นเอง ซึ่งการคำนวณอะไรพวกนี้มันอาศัยพลังในการคำนวณมหาศาลมาก ๆ เลยทำให้มี Project Folding@Home ที่ทำให้เราสามารถบริจาคพลังการคำนวณในเครื่องคอมพิวเตอร์ของเราให้นักวิจัยในการค้นหาข้อมูลพวกนี้ได้นั่นเอง นี่แหละ คือ การใช้พวก Protein Data มาเพื่อทำนายลักษณะโครงสร้าง 3D ของมัน
คนที่ Build เครื่องโหดมาก ๆ เพื่อ Contribute ให้งานนี้ที่เป็นสื่อที่เราเห็นเลย ก็น่าจะเป็น LTT นี่แหละ โคตรโหด ตอนที่นั่งดูคือ โอเค... เอาไปเลยจ้าาาา อัด GPU ไป 6 ใบเรียกว่า แรงยันโลกหน้าเลยทีเดียว มีใครอยากส่ง GPU มาเยอะ ๆ บอกได้นะ ฮา ๆ
เอาอีกสักอันละกัน ถ้าเราบอกว่า DNA ของเราก็เหมือนกับโปรแกรมคอมพิวเตอร์ขนาดใหญ่ พวกมะเร็ง และ โรคทางพันธุกรรมก็น่าจะเหมือนกับโปรแกรมที่ทำงานผิดพลาด เราสามารถใช้ Bioinformaics มาเพื่อทำความเข้าใจว่า จริง ๆ แล้วมันทำงานผิดพลาดตรงไหนทำให้เกิดความชิบหายมาได้ เมื่อเราเข้าใจกลไกพวกนี้ เราก็สามารถออกแบบยามาเพื่อขัดขวางการทำงานของขั้นตอนที่ผิดพลาดได้ ที่บางครั้งเราก็เรียกกันว่า Precision Medicine ตัวอย่างของการทำพวกนี้ก็เช่น ยาที่ใช้รักษามะเร็ง ที่เป็นยาจำเพาะ เช่นแก๊งค์ Getitinib และ Osimertinib พวกนั้น
อ่านไม่รู้เรื่องข้ามค่ะ ! ยาพวกนี้มันจะพุ่งเป้าในการขัดขวางการทำงานของ EGFR (Epidermal Growth Factor Receptor) พูดง่าย ๆ เป็นเหมือนเสาสัญญาณที่รับคำสั่งบอกให้ Cell มันสร้างตัวเองขึ้นมาเพิ่มเรื่อย ๆ ซึ่งมันมีเยอะมาก ๆ ในพวกก้อนมะเร็ง ทำให้มันขยายตัวเองเกินสิ่งที่ควรจะเป็น ไม่รู้จักหยุดเติบโต เป็น Cell ค่ะไม่ใช่ Productive Life Coach แล้วเสล่อไปขวางการทำงานของการสลาย Cell อีก (Cell Proliferation) หรือพูดอีกนัยคือ EGFR Overexpressed) อันเป็นสาเหตุหรือลักษณะหนึ่งของมะเร็งที่เราพบ
Bioinformatics vs Health Informatics บางคนก็เรียก Medical Informatics
คำถามนี้มีคนถามเข้ามาเยอะมาก ๆ จนเราคือ ห่ะะะ !! ได้เหรอวะ ?? มาคิดดี ๆ ก็ได้แหละ กับคำถามว่า Bioinformatics มันต่างจากพวก Health Informatics อย่างไร
สิ่งที่เหมือนกัน อย่างแรกคือ Informatics ที่ชื่อนั่นเอง เราบอกไปละว่ามันเป็นศาสตร์ที่ทำอะไร ทำให้มันเป็นศาสตร์ที่คล้ายกันตรงนี้แหละ แต่ Health Informatics มันจะเน้นไปในเรื่องของฝั่งพวก Health หรือพวกสายสุขภาพมากกว่า แต่ฝั่งของ Bioinformatics มันจะเน้นไปที่ฝั่งของ Biology การศึกษา การเข้าใจธรรมชาติมากกว่า แค่นั้นแหละ
สรุป
Bioinformatics เป็นศาสตร์นึงที่เราศึกษาเกี่ยวกับการจัดเก็บ และ การวิเคราะห์ข้อมูลทางชีวภาพ เรามองว่ามันเป็นเครื่องมือตัวนึงที่เราสามารถนำมาใช้ในการเข้าใจการทำงานของธรรมชาติลึกมากขึ้นกว่าเมื่อก่อน เปรียบเทียบยุคก่อนที่เราจะมีวิธีการจัดเก็บข้อมูลอย่างเป็นระบบ ปัญหาบางอย่าง เราก็ไม่สามารถตอบได้ แต่ตอนนี้เรามีวิธีการจัดเก็บข้อมูล เรามีระบบคอมพิวเตอร์เข้ามา ก็ทำให้เราตอบปัญหาที่ซับซ้อน ๆ หลาย ๆ อย่างได้ ฝั่งของ Biology ก็เหมือนกัน เราเลยต้องมี Bioinformatics เป็นเครื่องมือที่เข้ามาช่วยตอบปัญหาที่ซับซ้อนต่อไปได้นั่นเอง