福野泰介の一日一創 - create every day

遺伝暗号コドンの衝撃、生物は超小型2bitコンピューター!? 食べるをハックする蛋白質DNA編

2018/05/03
#health #IchigoJam #opendata 

塩コントロールに続く、食べるハック第二弾は蛋白質とDNA。
人の体、水が7割、2割が蛋白質。

人に必要な五大栄養素(カロリー=糖質*4+脂質*9+蛋白質*4(kcal))
1. 炭水化物 エネルギー4kcal/g(消化される糖質のみ、消化されないものは植物繊維)
2. 脂質 エネルギー9kcal/g
3. 蛋白質 エネルギー4kcal/g
4. ビタミン(上記以外で必要な有機物)
5. ミネラル(無機物)

蛋白質(たんぱく質=プロテイン)とは、20種類のアミノ酸が50以上つながった立体構造を持つ分子機械。 生体内でさまざまな機能を発揮する。 体の全細胞内にある、生命の設計図、DNA。DNAの一部をRNAとしてコピーし、アミノ酸列にデコードして、蛋白質を生成する構造(リボソーム)はまさにコンピューター。

TCAGによるDNAに対応するRNAはUCAG。1つ4種、2bit。これを3つ1組にしたものをコドンと呼び、その組み合わせは64種類。20種のアミノ酸との対応も判明していたので、サブルーチンでつくるDNAの続きで、RNAデコーダーを作ってみた。

100 C="FFLLSSSSYY..CC.WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG" 110 M=0:CLS 120 N=0:FOR I=1 TO 3 130 K=INKEY():IF !K CONT 140 POKE#A00+M,K:M=M+1 150 N=N<<2 160 IF K=ASC("C") N=N+1 170 IF K=ASC("A") N=N+2 180 IF K=ASC("G") N=N+3 190 NEXT 200 POKE#AC0-1+M/3,ASC(C+N) 210 GOTO 120

「RNAデコーダー」 - リボソームのデコード風プログラム
RNAの構成要素、UCAGを打ち込んでいくと対応するアミノ酸を表すアルファベットか終端コード"."が表示される。

コドン - Wikipediaより)

例えば、アミノ酸をつないでタンパク質を作ろうゲームに登場する、GSEIQPRという7つのアミノ酸の鎖でできたペプチド(50以上のアミノ酸列のものが蛋白質)、カルノシンを仮にRNAで表すとしたら

GGUUCUGAAAUUCAACCUCGU

となる(RUN on IchigoJam web
*蛋白質はメチオニンAUGから始まるものらしいので、実在しないDNA


多少のエラーにも対応できるコード体系。 DNAの中でアミノ酸に対応する部分(エクソン)は5%ほど、残りの部分(イントロン)もエラー耐性を高めたり、スキップの仕方で多様性を産んだりとおもしろい。 DNA末尾に TTAGGGTTAGGGTTAGGG... と無駄なコードを続けておくことでコピー毎に短くなっていくDNAを守る仕組み、などなど・・・。

なかなかうまいアーキテクチャーだな、と思うこれがコンピューターが影も形もなかった頃、自然界によって作られたものというのが信じられない。

分子機械、蛋白質、単純に50のアミノ酸を組み合わせ20の50乗、10の65乗とほぼ無量大数! ただし、機能する蛋白質には制限があり、失敗作は細胞を出る前に破壊される仕組みまである様子(ナンセンス変異依存mRNA分解機構)。 蛋白質の種類は数千万種類と言われ、世界中で解析が進むプロテインデータが「Protain Data Bank Japan」にて約14万のパブリックドメインな蛋白質オープンデータとして公開されている。

膨大なDNAから必要な部分をどう選んでいるのか?蛋白質の機能はどのように決まるのか?
自分という、一番身近で謎多きコンピューターのスペック解明という、楽しい旅!

links
- コドン - Wikipedia - 遺伝暗号、遺伝コード
- PDBj入門:PDBjの教育的コンテンツサイト - 蛋白質オープンデータ内
- 遺伝子の部屋
- 遺伝暗号を解読する鍵となる新メカニズムを発見  | 理化学研究所 (2014年6月23日)

Tweet
クリエイティブ・コモンズ・ライセンス
この作品は「Creative Commons — CC BY 4.0」の下に提供されています。
CC BY 福野泰介 - Taisuke Fukuno / @taisukef / アイコン画像 / プロフィール画像