Юникод
Юникод (Unicode же Уникод) — бардык жазуу тилдериндеги симболдорду кодтоо стандарты, компьютер технологиясында кеңири колдонулат. Бул стандарттын бир канч түрлөрү бар: UTF-8, UTF-16 (UTF-16BE, UTF-16LE) жана UTF-32 (UTF-32BE, UTF-32LE. Ошондой жаңы UTF-7 формасы иштелип чыккан. Бул стандарт 1991-жылы Юникод Консорциум (англисчеси: Unicode Consortium) уюму тарабынан сунушталган.
Көптөгөн кеңири таралган символдор, анын ичинде цифралар, тыныш белгилери жана башка символдор стандарттын алкагында унификацияланган жана белгилүү бир жазуу системасына мүнөздүү деп каралбайт.[1][2][3] Юникод 3790 эмодзини коддойт, жана Консорциум стандарттын алкагында алардын иштелип чыгуусун улантууда.[4] Мындан тышкары, Юникоддун кеңири таркашы эмодзинин Жапониядан тышкары популярдуулугуна олуттуу түрдө өбөлгө түздү. Юникод акыры 1,1 миллиондон ашык символдорду коддоого жөндөмдүү.
Юникод ар кандай локалдарда жана ар кандай компьютердик архитектураларда колдонулган көптөгөн дал келбеген символдор топтомдорун негизинен алмаштырды.[5][6] Юникод Интернеттеги басымдуу тексттерди, анын ичинде көпчүлүк веб-баракчаларын коддоо үчүн колдонулат,[7] жана Юникодду колдоо заманбап программанын иштеп чыгууда жалпы талапка айланды.
Юникод символдорунун репертуары ISO/IEC 10646 стандарты менен синхрондолгон жана алардын ар бири код боюнча бири-бири менен бирдей.[8][9] Бирок Юникод стандарт жөн гана символдор топтому эмес. Иштеп чыгуучуларга жана дизайнерлерге жардам берүү үчүн, стандарт схемаларды жана справкалык маалыматтарды, ошондой эле ар кандай жазуу системаларына тиешелүү түшүнүктөрдү түшүндүргөн жана алардын ишке киргизүү боюнча сунуштарды берген тиркемелерди сунуштайт. Бул тиркемелер камтыган темалар символдорду нормалдаштырууну, символдорду композициялоону жана декомпозициялоону, салыштыруу жана багытты камтыйт.[10]
Юникод кодировкасындагы текст стандарттын абстракттуу символдор коддорун байттардын ырааттуулугуна кантип айландырууну аныктоочу кодировкалардын бирин колдонуп, бинардык маалыматтар түрүндө иштетилип жана сакталат.[11] Юникод стандартында үч кодировка аныкталган: UTF-8, UTF-16 жана UTF-32, бирок башкалар да бар. Алардын ичинен UTF-8 эң кеңири колдонулат, анткени анын ASCII менен артка шайкештиги бар.
Шилтемелер
[түзөтүү | булагын түзөтүү]- ↑ Unicode. hyperskill.org. Текшерилген күнү 15 -ноябрь (жетинин айы) 2024.
- ↑ The Absolute Minimum Every Software Developer Must Know About Unicode. tonsky.me. Текшерилген күнү 15 -ноябрь (жетинин айы) 2024.
- ↑ Unicode's characters. czyborra.com. Текшерилген күнү 15 -ноябрь (жетинин айы) 2024.
- ↑ Emoji Counts, v16.0. www.unicode.org. Текшерилген күнү 15 -ноябрь (жетинин айы) 2024.
- ↑ Unicode is harder than you think. mcilloni.ovh. Текшерилген күнү 15 -ноябрь (жетинин айы) 2024.
- ↑ Programming with Unicode: a gentle introduction. www.internalpointers.com. Текшерилген күнү 15 -ноябрь (жетинин айы) 2024.
- ↑ Unicode Text Converter. charactercalculator.com. Текшерилген күнү 15 -ноябрь (жетинин айы) 2024.
- ↑ The Unicode Standard, Version 4.0. www.cesarkallas.net. Текшерилген күнү 15 -ноябрь (жетинин айы) 2024.
- ↑ Unicode character encoding. www.ibm.com. Текшерилген күнү 15 -ноябрь (жетинин айы) 2024.
- ↑ The Unicode® Standard: A Technical Introduction. www.unicode.org. Текшерилген күнү 15 -ноябрь (жетинин айы) 2024.
- ↑ A Programmer’s Introduction to Unicode. www.reedbeta.com. Текшерилген күнү 15 -ноябрь (жетинин айы) 2024.