Ang Unicode ay isang pamantayan para sa mga kompyuter upang magawa silang makapagpakita ng mga teksto sa iba't ibang mga wika o panitikan. Ang mga pamantayan ng Unicode ay nilikha ng Unicode Consortium (Unicode, Inc.). Layunin nilang palitan ang pangkasalukuyang mga pamantayan sa pag-eenkodigo o pagsasakodigo ng mga karakter na may isang pang-isahang pangbuong mundong pamantayan para sa lahat ng mga wika. Mayroon higit na 100,000 mga karakter sa pinakabagong kahulugan ng Unicode. Ang Unicode ay nilathala noong 1991.

Sa kasalukuyan, may iba't ibang mga paraan upang maisakodigo ang Unicode, ang pinaka pangkaraniwan ay ang mga sumusunod:

  • UTF-7, gumagamit ng 7 mga bit bawat karakter; hindi gaanong tanyag; opisyal na hindi bahagi ng Unicode
  • UTF-8, gumagamit ng 8 mga bit bawat karakter; isang pagsasakodigong may nababagong lapad na nagpapanatili ng kompatibilidad sa ASCII; ang pinaka pangkaraniwang mga karakter ay makokodigo sa loob ng 2 mga bayt
  • UTF-16, gumagamit ng 16 mga bit bawat karakter; isa ring pagsasakodigong may nababagong lapad
  • UTF-32, gumagamit ng 32 mga bit bawat karakter; isang may nakapirmi o hindi nababagong pagsasakodigo

Ang UTF-8 ang pinaka pangkaraniwan sa mga nabanggit sa itaas. Ginagamit ito para sa elektronikong liham. Gumagamit din ang wikang pamprogramang Java ng kahalawan nito.

Mga kawing panlabas

baguhin


   Ang lathalaing ito na tungkol sa Internet at Kompyuter ay isang usbong. Makatutulong ka sa Wikipedia sa pagpapalawig nito.