Ақпараттар мөлшері қалай өлшенеді?

1234

Мысалға, "Соғыс пен бейбітшілік" романының мәтінінде, Рафаэльдің фрескаларында, немесе адамның генетикалық кодында ақпараттардың қандай мөлшері бар? Бұл сұрақтарға ғылым жауап бере алмайды, және жақын арада жауап табуы да неғайбыл. Ал ақпараттар мөлшерін нақты өлшеу мүмкін бе?Ақпараттар теориясының маңызды нәтижесі келесі тұжырым болып табылады:

Белгілі бір, барынша ауқымды жағдайларда ақпараттардың сапалық ерекшеліктерін елемеуге болады, оның мөлшерін санмен өрнектейді, сол сияқты мәліметтердің әртүрлі топтарындағы ақпараттар мөлшерін салыстырады.

Қазіргі уақытта "ақпараттар мөлшері" ұғымын анықтауға бағытталған қадамдар кеңінен етек алды, олар мынаған негізделген, хабарлама құрамындағы ақпараттарды оның жаңашылдығы мағынасында немесе басқаша айтқанда, объект туралы біздің біліміміздің анықталмауының кемуі тұрғысында, байыппен беруге болады. Бұл қадамдар ықтималдық пен логарифм сияқты математикалық ұғымдарды пайдаланады.

Ақпараттар мөлшерін анықтауға арналған қадамдар. Хартли мен Шеннон формулалары. 1928 ж. америка инженері Р. Хартли ақпараттарды алу үрдісін алдын ала берілген тең ықтималдықтағы көптеген N хабарламалардың ішіндегі ақырғы біреуін таңдап алу тұрғысынан қарастырды, ал таңдап алынған хабарламалардағы ақпараттар мөлшері I, N.-нің екілік логарифмі арқылы анықталды.
Формула Хартли: I = log2N

Айталық, бірден жүзге дейінгі сандар жиынтығынан бір санды табу керек. Хартли формуласы бойынша бұл үшін ақпараттардың қандай мөлшері қажет екенін есептеуге болады:

I = log2100  6,644. Сол себептен, дұрыс табылған сан туралы хабарлама ақпараттар мөлшерінің шамамен алғанда 6,644-ке тең ақпараттық бірлігін құрайды.

Тең ықтималдықты хабарламалардың басқа да мысалдарын келтірейік:

1. монеталарды тастау кезіндегі: " решка түсті", " орел түсті";



2. кітап бетіндегі: "әріптер саны жұп", "әріптер саны тақ".

Енді мынаны анықтайық, мына хабарламалар тең ықтималдықты бола ма "ғимараттың есігінен бірінші әйел шығады" және "ғимараттың есігінен бірінші еркек шығады". Бұл сұраққа біржақты жауап беруге болмайды. Барлығы да әңгіменің қандай ғимарат туралы екендігіне байланысты. Егер бұл, мысалға, метро станциясы болса, онда есіктен бірінші шығу ықтималдығы ерлер мен әйелдер үшін бірдей, ал егер бұл әскери казарма болса, онда ерлер үшін бұл ықтималдық әйелдерге қарағанда әлдеқайда жоғары.

Осындай мағынадағы тапсырмалар үшін америка ғалымы Клод Шеннон 1948 ж. таңдалған хабарламаларда бірдей емес ықтималдықтың болуын ескеретін, ақпараттар мөлшерін анықтаудың басқа формуласын ұсынды.

Шеннона формуласы: I = — ( p1log2 p1 + p2 log2 p2 + . . . + pN log2 pN), мұндағы pi — i-ші хабарламаның N хабарламалар жиынынан алынғандығының ықтималдығы.

Мынаны аңғару оңай, егер p1, ..., pN ықтималдықтары тең болса, онда олардың әрқайсысы 1 / N-ға тең, бұл жағдайда Шеннон формуласы Хартли формуласына айналады.

Ақпараттар мөлшерін анықтауға арналған қарастырылған екі қадамнан басқа да қадамдар бар. Мынаны есте сақтау керек, кез келген теориялық нәтижелер алғашқы шарттарымен анықталатын, белгілі бір жағдайлар үшін ғана қолданылады.

Ақпараттар бірлігі ретінде Клод Шеннон бір бит (ағыл. bit — binary digit — екілік сан) алуды ұсынды.

Ақпараттар теориясында бит—тең ықтималдықтағы екі хабарламаны ажырататын ақпарат мөлшері (түрлері "орел"—"решка", "жұп"—"тақ" және т.б.). Есептеу техникасында бит дегеніміз мәліметтер мен командалардың машинаішілік ұғымда қолданылуы үшін пайдаланылатын, "0" мен "1" белгілерінің біреуін сақтауға қажетті, компьютер жадының ең аз "бөлігі".

Бит — өлшем бірліктің өте аз шамасы. Практикада көбінесе одан ірі бірлік — байт қолданылады, ол сегіз битке тең. Компьютер пернелеріндегі 256 символдың кез келген біреуін кодтау үшін дәл осы сегіз бит қажет (256=28).

Сол сияқты ақпараттардың одан да үлкенірек туынды бірліктері кеңінен қолданылады :

· 1 Килобайт (Кбайт) = 1024 байт = 210 байт,

· 1 Мегабайт (Мбайт) = 1024 Кбайт = 220 байт,

· 1 Гигабайт (Гбайт) = 1024 Мбайт = 230 байт.

Соңғы уақытта өңделетін ақпараттар көлемінің ұлғаюына байланысты, қолданысқа мынандай туынды бірліктер де ене бастады:

· 1 Терабайт (Тбайт) = 1024 Гбайт = 240 байт,

· 1 Петабайт (Пбайт) = 1024 Тбайт = 250 байт.

Ақпараттар бірлігі ретінде он тең ықтималдықтағы хабарламаларды ажыратуға қажетті, ақпараттар мөлшерін таңдап алуға да болатын еді. Бұл енді екілік емес (бит), ондық (дит) ақпарат бірлігі болады.


7425353722719082.html
7425401627738091.html
    PR.RU™