Генетический код, заложенный в молекулах ДНК, представляет собой уникальный язык, раскрывающий тайны нашего наследственного материала. Но какое количество информации реально хранит в себе наше ДНК? Давайте посчитаем!
ДНК кодируется четырьмя основными нуклеотидами: аденином (A), тимином (T), гуанином (G) и цитозином (C). Каждый из этих нуклеотидов представляет собой букву генетического «алфавита». Информация в ДНК закодирована последовательностью этих нуклеотидов.
Согласно формуле Хартли, количество информации определяется как I = log2N, где N — число возможных состояний системы. На определенной позиции в цепочке ДНК может с примерно одинаковой вероятностью стоять любой из четырех повторяющихся нуклеотидов. Следовательно, нуклеотид, который там реально находится, заключает в себе log24 = 2 бита информации.
Длина молекулы ДНК у человека зависит от количества генетической информации, заключенной в его геноме. Человеческий геном состоит примерно из 3 миллиардов пар оснований (базовых пар). Пара оснований включает сочетание аденина (A) с тимином (T) и гуанина (G) с цитозином (C).
Умножая количество информации, содержащееся в одном нуклеотиде на длину молекулы ДНК (включая базовые пары), можно получить ее информационную емкость, то есть предельное количество закодированной информации, которое там хранится. Геном самого маленького известного вируса (цирковируса свиней) вмещает 3518 бит, а геном человека — примерно 6,4 миллиарда бит (около 800 Мбайт). Для сравнения — это примерно 60-70 минут музыки хорошего качества!