Bitt

Bittide arv	Olekute arv
0	1
1	2
2	4
3	8
4	16
8	256
10	1024
16	65 536
32	4 294 967 296

Bitt (inglise keeles bit sõnadest binary digit, binaarnumber) on informaatikas ja infotehnoloogias digitaalkujul esitatud andmete mõõtühik, vastab ühele kahendkohale 0 või 1.^[1] 1 bitt on vähim käsitletav andmehulk. 8 bitti moodustavad infohulga ühiku bait.

Bitt on kõige põhilisem teabeühik arvutuses ja digitaalsides.^[2] Nimi on portmanteau binaarsest numbrist. Bitt tähistab loogilist seisundit, millel on üks kahest võimalikust väärtusest. Neid väärtusi esitatakse kõige sagedamini kas "1" või "0", kuid laialdaselt kasutatakse ka muid esitusviise, nagu tõene/vale, jah/ei, sisse/välja või +/-.

Seos nende väärtuste ja nende aluseks oleva mälu või seadme füüsiliste olekute vahel on kokkuleppeline ning isegi ühe ja sama seadme või programmi piires võib kasutada erinevaid määranguid. Füüsiliselt võib seda rakendada kahe oleku seadmega.

Sõltumatult füüsikalisest esitusest võib bitti vaadelda kui üht kahest võimalikust sündmusest või seisundist.

Ühesugust binaararvude rühma nimetatakse tavaliselt bittide jadaks, bittivektoriks või ühemõõtmeliseks (või mitmemõõtmeliseks) bitimassiiviks. Kaheksast bitist koosnevat rühma nimetatakse üheks baidiks, kuid ajalooliselt ei ole baidi suurus rangelt määratletud.^[3] Sageli koosnevad pool-, täis-, kahe- ja neljakordsed sõnad baitide arvust, mis on kahe väike võimsus. Neljast bitist koosnev jada on tavaliselt nibble.

Infoteoorias on üks bitt juhusliku binaarse muutuja, mis on võrdse tõenäosusega 0 või 1,^[4] informatsiooni entroopia ehk teave, mis saadakse, kui sellise muutuja väärtus saab teada.^[5] ^[6]

Biti kui informatsiooni ühik on tuntud ka kui shannon, ^[7] mis on saanud nime Claude E. Shannoni järgi.

Standardi IEC 80000-13:2008 kohaselt on binaararvu sümboliks kas "bit" või standardi IEEE 1541-2002 kohaselt väiketäht "b". Viimase kasutamine võib tekitada segadust suurtähe "B" kasutamisega, mis on baitide rahvusvaheline standardsümbol.

Üks infobitt, mis on võrdne 0 (null) - lamp on välja lülitatud. Üks infobitt võrdub 1 (üks) - lamp on sisse lülitatud.

Ajalugu

Andmete kodeerimist diskreetsete bittidega kasutati Basile Bouchoni ja Jean-Baptiste Falconi (1732) leiutatud augukaartides, mida arendas edasi Joseph Marie Jacquard (1804) ja mille võtsid hiljem kasutusele Semjon Korsakov, Charles Babbage, Herman Hollerith ja varased arvutitootjad, nagu IBM. Selle idee üheks variandiks oli perforeeritud paberilint. Kõigis neis süsteemides kandis andmekandja (kaart või lind) põhimõtteliselt augu positsioonide massiivi; iga positsiooni võis kas läbi lüüa või mitte, kandes seega ühte bitti teavet. Teksti kodeerimist bittidega kasutati ka Morse koodis (1844) ja varajases digitaalses sideseadmes, näiteks teletehnikas ja börsiliinimasinates (1870).

Ralph Hartley tegi 1928. aastal ettepaneku kasutada logaritmilist infomõõdustikku. 1948. aastal kasutas Claude E. Shannon esimest korda sõna "bit" oma fundamentaalses artiklis "A Mathematical Theory of Communication".^[8] Ta omistas selle päritolu John W. Tukeyle, kes kirjutas 9. jaanuaril 1947 Bell Labsi memo, milles ta lühendas "binaarse infokvoodi" lihtsalt "bitiks".

Füüsiline esindatus

Biti võib salvestada digitaalne seade või muu füüsiline süsteem, mis eksisteerib kahes erinevas olekus. Need võivad olla flip-flopi kaks stabiilset seisundit, elektrilise lüliti kaks asendit, kaks erinevat pinge- või voolutaset, mida vooluahelas on lubatud, kaks erinevat valgusintensiivsuse taset, kaks magnetiseerimise või polarisatsiooni suunda, pöörduv topelttüvelise DNA orientatsioon jne.

Bitid võivad olla rakendatud mitmel kujul. Enamikus kaasaegsetes andmetöötlusseadmetes on bitt tavaliselt kujutatud elektrilise pinge- või vooluimpulsi või flip-flop-ahela elektrilise olekuga.

Positiivset loogikat kasutavates seadmetes kujutatakse numbri väärtust 1 (või loogilist väärtust tõene) positiivsema pingega võrreldes 0 kujutamisega. Erinevad loogikapered nõuavad erinevaid pingeid ning erinevused on lubatud, et võtta arvesse komponentide vananemist ja mürakindlust. Näiteks transistor-transistoriloogika (TTL) ja sellega ühilduvate ahelate puhul esitatakse numbrite väärtused 0 ja 1 seadme väljundis vastavalt mitte kõrgemal kui 0,4 volti ja mitte madalamal kui 2,6 volti; samas kui TTL-sisendid on määratletud nii, et 0,8 volti või madalam kui 0 ja 2,2 volti või kõrgem kui 1. See tähendab, et 0 ja 1 ei tohi olla suuremad kui 2,4 volti.

Edastamine ja töötlemine

Bitid edastatakse jadaülekandes ükshaaval ja paralleelülekandes mitu bitti korraga. Bitioperatsiooniga töödeldakse bitid valikuliselt ükshaaval. Andmeedastuskiirust mõõdetakse tavaliselt kümnendmurdes SI-kordse ühikuga bitt sekundis (bit/s), näiteks kbit/s. See tähendab, et andmeedastuskiirust mõõdetakse kümnendmurdes SI-kordse ühikuga bitt sekundis.

Ladustamine

Kõige varasemates mitteelektroonilistes andmetöötlusseadmetes, nagu Jacquardi kangastelgede või Babbage'i analüütilise mootori puhul, salvestati bit sageli mehaanilise hoova või hammasratta asendina või paberkaardi või -lindi konkreetses punktis oleva augu olemasolu või puudumise kujul. Esimesed elektrilised diskreetse loogika seadmed (näiteks liftide ja valgusfooride juhtimisahelad, telefonilülitid ja Konrad Zuse arvuti) kujutasid bite elektriliste releede olekuna, mis võisid olla kas "avatud" või "suletud". Kui releed asendati 1940. aastatest alates vaakumtorudega, katsetasid arvutite ehitajad mitmesuguseid salvestusmeetodeid, näiteks elavhõbedast viivitusliinil kulgevaid rõhuimpulsse, katoodkiiretoru sisepinnale salvestatud laenguid või fotolithograafiliste meetoditega klaaskettale trükitud läbipaistmatuid laike.

1950. ja 1960. aastatel asendasid need meetodid suures osas magnetilised salvestusseadmed, nagu magnetkärgmälu, magnetlindid, trumlid ja kettad, kus biti kujutas endast ferromagnetilise kile teatava ala magnetiseerimise polaarsust või polaarsuse muutumist ühest suunast teise. Sama põhimõtet kasutati hiljem 1980. aastatel välja töötatud magnetmullmälus, mida leidub siiani mitmesugustes magnetribaga esemetes, näiteks metroopiletites ja mõnes krediitkaardis.

Ühik ja sümbol

Biti ei ole määratletud rahvusvahelises ühikute süsteemis (SI). Rahvusvaheline elektrotehniline komisjon on siiski välja andnud standardi IEC 60027, milles on sätestatud, et binaarse arvu sümboliks peaks olema "bit" ja seda tuleks kasutada kõigis kordades, näiteks "kbit" kilobiti jaoks.^[9] Siiski on laialdaselt kasutusel ka väiketäht "b", mida soovitati standardis IEEE 1541 (2002). Seevastu suurtäht "B" on standardne ja tavapärane baidi sümbol.

Teabevõime ja teabe kokkusurumine

Kui salvestussüsteemi või sidekanali infomahutavust esitatakse bittides või bitides sekundis, peetakse sageli silmas binaarkohti, mis on arvuti riistvara võime salvestada binaarseid andmeid (0 või 1, üles või alla, voolu või mitte jne). Salvestussüsteemi infomahutavus on ainult ülemine piir selles salvestatava teabe kogusele. Kui ühe salvestusbiti kaks võimalikku väärtust ei ole võrdse tõenäosusega, sisaldab see salvestusbitt vähem kui üks bitt informatsiooni. Kui väärtus on täiesti ennustatav, siis selle väärtuse lugemine ei anna üldse mingit teavet (null entroopilist bitti, sest ebakindluse lahendamist ei toimu ja seega ei ole teavet). Kui arvutifail, mis kasutab n bitti mälu, sisaldab ainult m < n bitti teavet, siis saab seda teavet põhimõtteliselt kodeerida umbes m bitiga, vähemalt keskmiselt. See põhimõte on andmekompressioonitehnoloogia aluseks. Analoogiat kasutades viitavad riistvaralised binaararvud olemasolevale salvestusruumile (nagu ämbrite arv, mis on saadaval asjade salvestamiseks) ja infosisu täitmisele, mis on erineva granulaarsusega (peen või jäme, st kokkusurutud või kokkusurumata teave). Kui granulaarsus on peenem - kui teave on rohkem kokkusurutud -, saab ühte ämbrisse mahutada rohkem. Näiteks on hinnatud, et kogu maailma tehnoloogiline võimekus teabe salvestamiseks annab 1300 eksabaiti riistvara numbrite kohta. Kui see salvestusruum on aga täidetud ja vastav sisu optimaalselt kokku surutud, moodustab see vaid 295 eksabaiti informatsiooni. optimaalselt kokku surutud kujul läheneb saadud kandevõime Shannoni informatsiooni ehk informatsiooni entroopiale.^[10]

Bitipõhine andmetöötlus

Teatavad bittide kaupa arvutiprotsessori käsklused (näiteks biti komplekt) töötavad pigem bittidega manipuleerimise kui bittide kogumina tõlgendatavate andmete manipuleerimise tasandil.

Kui 1980. aastatel muutusid populaarseks bittkaardistatud arvutiekraanid, pakkusid mõned arvutid spetsiaalseid bittide plokkide ülekandmise juhiseid, et määrata või kopeerida ekraanil antud ristkülikukujulisele alale vastavaid bitte.

Kui enamikus arvutites ja programmeerimiskeeltes viidatakse bittide grupi, näiteks baidi või sõna sees olevale bitile, määratakse see tavaliselt numbriga 0-st ülespoole, mis vastab selle positsioonile baidis või sõnas. Olenevalt kontekstist võib 0 siiski viidata kas kõige või kõige vähem tähtsamale bitile.

Muud teabeüksused

Sarnaselt pöördemomendi ja energiaga füüsikas; teabeteoreetilisel informatsioonil ja andmesalvestuse suurusel on sama mõõtühikute dimensioon, kuid üldiselt ei ole nende ühikute liitmisel, lahutamisel või muul viisil matemaatiliselt kombineerimisel mingit mõtet, kuigi üks võib toimida teise piirina.

Infoteoorias kasutatavad informatsiooni mõõtühikud on shannon (Sh), naturaalne informatsiooni ühik (nat) ja hartley (Hart). Üks shannon on maksimaalne infokogus, mis on vajalik ühe mälubiti seisundi täpsustamiseks. Need on omavahel seotud järgmiselt: 1 Sh ≈ 0,693 nat ≈ 0,301 Hart.

Mõned autorid defineerivad binit ka kui suvalist informatsiooniühikut, mis on samaväärne mingi kindla, kuid täpsustamata bitide arvuga. ^[11]

Vaata ka

Viited

↑ Vello Hanson, Harri Tavast (2008). Arvutikasutaja sõnastik. Tallinn: Ilo.
↑ Charles E. Mackenzie (1980). "The Systems Programming Series". [Addison-Wesley Publishing Company, Inc.] (toim). Coded Character Sets, History and Development (PDF) (inglise). London, Amsterdam.
↑ Berner, Robert William (8. august 2000). ""Why is a byte 8 bits? Or is it?"" (inglise). Originaali arhiivikoopia seisuga 3. aprill 2017. The IBM 360 used 8-bit characters, although not ASCII directly. Thus Buchholz's "byte" caught on everywhere. I myself did not like the name for many reasons.{{netiviide}}: CS1 hooldus: robot: algse URL-i olek teadmata (link)
↑ John B Anderson, Rolf Johnesson (2006). Understanding Information Transmission.
↑ Simon Haykin (2006). Digital Communications.
↑ IEEE_260"IEEE Std 260.1-2004
↑ Norman Abramson (1963). Information Theory and coding.
↑ Claude Elwood Shannon (1948). A Mathematical Theory of Communication (PDF) (inglise). Originaali arhiivikoopia seisuga 15. juuli 1998. Vaadatud 25. aprillil 2024.{{raamatuviide}}: CS1 hooldus: robot: algse URL-i olek teadmata (link)
↑ National Institute of Standards and Technology (2008). Guide for the Use of the International System of Units (PDF) (inglise).
↑ Martin Hilbert, Priscila Lopez (10. veebruar 2011). "The World's Technological Capacity to Store, Communicate, and Compute Information". {{ajakirjaviide}}: viitemall journal nõuab parameetrit |journal= (juhend)
↑ Amitabha Bhattacharya (2005). McGraw-Hill Education (India) Pvt Limited (toim). Digital Communication (inglise). ISBN 0070591172.

[1] Vello Hanson, Harri Tavast (2008). Arvutikasutaja sõnastik. Tallinn: Ilo.

[2] Charles E. Mackenzie (1980). "The Systems Programming Series". [Addison-Wesley Publishing Company, Inc.] (toim). Coded Character Sets, History and Development (PDF) (inglise). London, Amsterdam.

[3] Berner, Robert William (8. august 2000). ""Why is a byte 8 bits? Or is it?"" (inglise). Originaali arhiivikoopia seisuga 3. aprill 2017. The IBM 360 used 8-bit characters, although not ASCII directly. Thus Buchholz's "byte" caught on everywhere. I myself did not like the name for many reasons.{{netiviide}}: CS1 hooldus: robot: algse URL-i olek teadmata (link)

[4] John B Anderson, Rolf Johnesson (2006). Understanding Information Transmission.

[5] Simon Haykin (2006). Digital Communications.

[6] IEEE_260"IEEE Std 260.1-2004

[7] Norman Abramson (1963). Information Theory and coding.

[8] Claude Elwood Shannon (1948). A Mathematical Theory of Communication (PDF) (inglise). Originaali arhiivikoopia seisuga 15. juuli 1998. Vaadatud 25. aprillil 2024.{{raamatuviide}}: CS1 hooldus: robot: algse URL-i olek teadmata (link)

[9] National Institute of Standards and Technology (2008). Guide for the Use of the International System of Units (PDF) (inglise).

[10] Martin Hilbert, Priscila Lopez (10. veebruar 2011). "The World's Technological Capacity to Store, Communicate, and Compute Information". {{ajakirjaviide}}: viitemall journal nõuab parameetrit |journal= (juhend)

[11] Amitabha Bhattacharya (2005). McGraw-Hill Education (India) Pvt Limited (toim). Digital Communication (inglise). ISBN 0070591172.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]