Ang ISO 639-3: 2007, o Codes for the representation of names of languages – Part 3: Alpha-3 code for comprehensive coverage of languages sa Ingles, ay isang pamantayang internasyonal para sa mga kodigo ng wika sa seryeng ISO 639. Nagtatakda ito ng tatlong letrang kodigo para sa pagkakakilanlan ng mga wika. Inilathala ang pamantayan ng ISO noong 1 Pebrero 2007.[1]

Pinapalawig ng ISO 639-3 ang mga kodigong alpha-3 ng ISO 639-2 na may layuning saklawin ang lahat ng kilalang wikang natural. Ang pinalawak na saklaw ng wika ay batay sa mga kodigo ng wika na ginamit sa Ethnologue (tomong 10-14) na inilathala ng SIL International, na sa ngayon ay ang awtoridad sa pagpaparehistro para sa ISO 639-3.[2] Nagbibigay ito ng isang talaan ng mga wika na kumpleto hangga't maaari, kabilang ang buhay at patay na, sinaunang at inimbento, malalaki at menor, nakasulat at hindi nakasulat.[1] Gayunpaman, hindi kabilang dito ang mga muling nabuong wika tulad ng Proto-Indo-Europeo.[3]

Inilaan ang ISO 639-3 upang gamitin bilang kodigong metadata sa iba't ibang mga aplikasyon. Kadalasang ginagamit ito sa mga sistema ng kompyuter at impormasyon, tulad ng Internet, kung saan kailangang suportahin ang maraming mga wika. Sa mga arkibo at iba pang imbakan ng impormasyon, ginagamit ang mga ito sa mga sistema ng pagkatalogo, na nagpapahiwatig ng wika o tungkol sa wika ng isang pagkukunan. Madalas ding ginagamit ang mga kodigo sa lingguwistang panitikan at sa ibang lugar upang mabawi ang katotohanan na maaaring maging hindi malinaw o hindi klaro ang mga pangalan ng wika .

Maghanap ng isang wika
Magpasok ng isang kodigong ISO 639-3 upang mahanap ang nararapat na artikulo ng wika.

Mga kodigo ng wika baguhin

Kabilang sa ISO 639-3 ang lahat ng mga wika sa ISO 639-1 at lahat ng mga indibidwal na wika sa ISO 639-2. Nakatuon ang ISO 639-1 at ISO 639-2 sa mga malalaking wika, na kadalasang kinakatawan sa kabuuang lawas ng panitikan sa mundo. Sapagkat kabilang din sa ISO 639-2 ang mga koleksyon ng wika at ang hindi kasama sa Ika-3 Bahagi, hindi isang superset ng ISO 639-2 ang ISO 639-3. Kung mayroong kodigong B at T sa ISO 639-2, ginagamit ng ISO 639-3 ang mga kodigong T.

Mga halimbawa:

wika 639-1 639-2 (B/T) 639-3
uri
639-3

kodigo

Ingles en eng indibidwal eng
Aleman de ger/deu indibidwal deu
Arabe ar ara makro ara
indibidwal arb + at iba pa
Tsino zh chi/zho[4][5] makro zho
Mandarin indibidwal cmn
Kantones indibidwal yue
Minnan indibidwal Nan

Magmula noong 25 Enero 2019 (2019 -01-25), naglalaman ang pamantayan ng 7,865 na tala.[6] Ang imbentaryo ng mga wika ay batay sa mga iilang mapagkukunan kabilang ang: mga indibidwal na mga wika na kasama sa 639-2, mga modernong wika mula sa Ethnologue, makasaysayang mga baryante, mga sinaunang wika at wikang artipisyal mula sa Linguist List,[7] pati na rin ang mga wika na inimumungkahi sa loob ang taunang panahon ng pampublikong pagkomento.

Ang mga file ng datos na nababasa ng makina ay ibinibigay ng awtoridad sa pagpaparehistro.[6] Maaaring gumawa ng mga paghahanay mula sa ISO 639-1 o ISO 639-2 papunta sa ISO 639-3 gamit ang mga data file na ito.

Nilayon ang ISO 639-3 upang ipalagay ang mga pagkakaiba batay sa mga pamantayan na hindi gaanong subhektibo.[8] Hindi ito nilayon upang idokumento o magbigay ng mga pagkakakilanlan para sa mga diyalekto o iba pang mga baryante ng sub-wika.[9] Gayunpaman, maaaring maging subhektibo ang mga paghatol tungkol sa mga pagkakaiba sa mga wika, lalo na sa kaso ng mga wikang oral na walang itinatag na mga tradisyong pampanitikan, paggamit sa edukasyon o medya, o iba pang mga salik na nagbibigay ng kontribusyon sa wika.

Puwang ng kodigo baguhin

Dahil alpabetikong tatlong-titik ang kodigo, ang isang taas na hangganan para sa bilang ng mga wika na maaaring kakatwanin ay 26 × 26 × 26 = 17,576. Dahil tinutukoy ng ISO 639-2 ang mga espesyal na kodigo (4), ang isang nakalaang hanay (520) at mga code na B lamang (22), hindi magagamit ang 546 na mga kodigo sa ika-3 bahagi. Samakatuwid, ang isang mas striktong taas na hangganan ay 17,576 - 546 = 17,030.

Nagiging mas mahigpit ang taas na hangganan kung ibabawas ang mga koleksyon ng wika na tinukoy sa 639-2 at ang mga tutukuyin pa lamang sa ISO 639-5.

Makrolengguwahe baguhin

Mayroong 58 wika sa ISO 639-2 na itinuturing, para sa mga layunin ng pamantayan, bilang mga "makrolengguwahe" sa ISO 639-3.[10]

Ang ilan sa mga makrolengguwahe ay walang indibidwal na wika na binigay-kahulugan ng ISO 639-3 sa hanay ng kodigo ng ISO 639-2, hal. 'ara' (Pangkalahatang Arabe). Ang iba pa katulad ng 'nor' (Noruwego) ay may dalawang indibidwal na bahagi ('nno' (Nynorsk), 'nob' (Bokmål)) na nasa ISO 639-2.

Ang ibig sabihin nito ay ilan sa mga wika (hal. 'arb', Pamantayang Arabe) na itinuturing ng ISO 639-2 bilang diyalekto ng isang wika ('ara') ay nasa ISO 639-3 ngayon sa ilang mga konteksto kung saan itinuturing ang mga ito bilang mga indibidwal na wika mismo.

Isang pagtatangka ito upang makitungo sa mga baryante na maaaring naiiba mula sa bawat isa sa lingguwistikang aspeto, ngunit itinuturing ng kanilang mga nagsasalita bilang dalawang anyo ng parehong wika, hal. sa mga kaso ng diglosya.

Halimbawa:

Tingnan ang[11] para sa buong talaan.

Mga kolektibong wika baguhin

"Ang isang kolektibong elemento ng kodigong pangwika ay isang pagkakakilanlan na kumakatawan sa isang pangkat ng mga indibidwal na mga wika na hindi itinuturing bilang isang wika sa anumang konteksto sa paggamit."[12] Hindi tumpak na kumakatawan ang mga kodigong ito sa isang partikular na wika o makrolengguwahe.

Habang may kasamang tatlong-titik na mga pagkakakilanlan ang ISO 639-2 para sa mga kolektibong wika, hindi kasama ang mga kodigong ito sa ISO 639-3. Samakatuwid, hindi superset ng ISO 639-2 ang ISO 639-3.

Dinepinhin ng ISO 639-5 ang mga 3-titik na kolektibong kodigo para sa mga pamilya at pangkat ng wika, kasama ang mga kolektibong kodigo ng wika mula sa ISO 639-2.

Mga espesyal na kodigo baguhin

Itinatabi ang apat na kodigo sa ISO 639-2 at ISO 639-3 para sa mga kaso kung saan walang naaangkop na espesipikong kodigo. Inilaan ang mga ito lalo na para sa mga aplikasyon tulad ng mga database kung saan kailangan ang isang kodigong ISO kahit mayroon man o wala.

mis Mga hindi nakakodigong wika
mul Maramihang wika
und Hindi tiyak
zxx Walang lingguwistikang nilalaman/Hindi naaangkop
  • mis (orihinal na pagdadaglat para sa 'samut-sari' o 'miscellaneous' sa Ingles) ay inilaan para sa mga wika na hindi pa kasama sa pamantayan ng ISO.
  • mul ay nilayon para sa mga kaso kung saan nagsasama ang datos ng higit sa isang wika, at (halimbawa) nangangailangan ang database ng isang kodigong ISO.
  • und ay inilaan para sa mga kaso kung saan hindi nakilala ang wika sa datos, tulad ng kung may maling tatak ito o hindi kailanman natatak. Hindi ito inilaan para sa mga kaso tulad ng Troyano kung saan ang isang wika na walang dokumentasyon ay binigyan ng pangalan.
  • zxx ay nilayon para sa datos na hindi wika talaga, tulad ng mga ingay ng hayop.[13]

Bilang karagdagan, ang 520 na code sa saklaw qaaqtz ay 'nakalaan para sa lokal na paggamit'. Halimbawa, ginagamit ang mga ito ng Linguist List para sa mga patay na wika. Itintakda ng Linguist List ng pangkaraniwang halaga:

qnp proto-wika na walang pangalan (Linguist List lamang)

Ginagamit ito para sa mga iminungkahing intermedyang nodo sa isang puno ng pamilya na walang pangalan.

Mga proseso ng pagpapanatili baguhin

Bukas sa mga pagbabago ang talahanayan ng kodigo ng ISO 639-3. Upang maprotektahan ang katatagan ng paggamit, limitado ang mga pinahihintulutang pagbabago sa:[14]

  • pagbabago sa impormasyong pansanggunian para sa isang tala (kabilang ang mga pangalan o pagkakategorya at saklaw),
  • pagdaragdag ng mga bagong tala,
  • pagbabawas ng mga tala na duplikado o hindi totoo,
  • pagsasama ng isa o higit pang mga tala sa isa pang tala, at
  • paghahati ng isang umiiral na talaang wika sa maraming bagong talaang wika.

Hindi binabago ang kodigo na nakatalaga sa isang wika maliban kung may pagbabago din sa denotasyon.[15]

Ginagawa ang mga pagbabago bawat taon. Ang bawat kahilingan ay bibigyan ng panahong hindi bababa sa tatlong buwan para sa pampublikong pagsusuri.

Ang websayt ng ISO 639-3 ay may mga pahina na naglalarawan sa "saklaw ng denotasyon"[16] (uri ng languoid) at mga uri ng mga wika,[17] na nagpapaliwanag kung anong mga konsepto ang nasa saklaw ng pagenkodigo at ilang pamantayan na kailangang matugunan. Halimbawa, maaaring ienkodigo ang mga nabuong wika, ngunit maaari lamang ito kung idinisenyo ito para sa komunikasyon ng tao at kung mayroong nang isang katawan ng panitikan, na pumipigil sa mga kahilingan para sa mga idiosynkratikong imbensyon.

Inilista ng awtoridad sa pagpaparehistro sa kanilang websayt ang mga tagubilin na gawa sa teksto ng pamantayang ISO 639-3 tungkol sa paraan kung paano dapat panatilihin ang mga talahanayan ng code.[18] Iniuulat din nito ang mga proseso na ginagamit para sa pagtanggap at pagproseso ng mga kahilingan sa pagbabago.[19]

Ibinibigay ang isang form panghiling ng pagbabago, at mayroong pangalawang form para sa pagkolekta ng impormasyon tungkol sa mga iminungkahing mga karagdagan. Maaaring magsumite ang sinuman ng mga kahilingan sa pagbabago. Kapag isinumite, sinisiyasat muna ang mga kahilingan ng awtoridad ng pagpaparehistro para sa pagiging kumpleto.

Kapag natanggap ang isang kahilingan na dokumentado, idinagdag ito sa isang nailathalang Index sa Palitan ng Kahilingan (Change Request Index). Bilang karagdagan, ipinapadala ang mga anunsyo sa pangkalahatang listahan ng talakayan ng LINGUIST sa Linguist List at iba pang mga listahan ng awtoridad sa pagpaparehistro ay maaaring isaalang-alang bilang may kaugnayan, na nag-aanyaya ng pampublikong pagsusuri at opinyon sa hiniling na pagbabago. Maaaring humiling ang sinumang may-ari ng listahan o indibidwal ng mga abiso ng mga kahilingan sa pagbabago para sa partikular na mga rehiyon o mga pamilya ng wika. Inilalathala ang mga natanggap na komento para suriin ng ibang mga partido. Ayon sa pinagkasunduan sa mga natanggap na komento, maaaring bawiin o itaas ang katayuan ng isang kahilingan sa pagbabago bilang "istadong kandidato".

Tatlong buwan bago ang katapusan ng isang taunang ikot ng pagsusuri (kadalasan sa Setyembre), nakatakda ang isang pahayag sa listahan ng talakayan ng LINGUIST at iba pang mga listahan hinggil sa Kahilingan sa Pagbabago ng Katayuan ng Kandidato (Candidate Status Change Requests). Nananatiling bukas ang lahat ng mga kahilingan para sa pagsusuri at pagkokomento hanggang sa katapusan ng taunang ikot ng pagsusuri.

Inihahayag ang mga desisyon sa katapusan ng taunang ikot ng pagsusuri (kadalasan sa Enero). Sa oras na iyon, ang mga kahilingan ay maaaring gamitin sa kabuuan o sa bahagi, susugan at isulong sa susunod na ikot ng pagsusuri, o tanggihan. Kadalasan ang mga pagtanggi ay may kasamang mga mungkahi kung paano baguhin ang mga panukala para sa susunod na pagsumite. Pinananatili ang isang pampublikong arkibo ng bawat kahilingan sa pagbabago kasama ang mga napasiyahan at ang makatwirang paliwanag para sa mga desisyon.[20]

Pamimintas baguhin

Nagtaas ang mga dalubwikang na si Morey, Post at Friedman ng iba't ibang mga pamumuna ng ISO 639, at sa partikular ang ISO 639-3:[21]

  • Nakapagdududa ang mga tatlong titik na kodigo, kahit opisyal na arbitraryo ang mga teknikal na tatak, dahil kadalasan nagmumula sila sa mga nimonikong pagpapaikli o mnemonic abbreviation ng mga pangalan ng wika, ang ilan sa mga ito ay nakakagalit. Halimbawa, itinalaga sa Yemsa ang kodigong [jnj], mula sa pehoratibong "Janejero". Maaaring ituring ng mga kodigo na ito bilang nakakagalit sa mga katutubong nagsasalita, ngunit ang mga kodigo sa pamantayan, kapag nakatalaga na, ay hindi na mababago.
  • May suliranin ang pangangasiwa ng pamantayan dahil isang organisasyon ng misyonero ang SIL na may kakulangan sa aninaw at pagiging responsable. Ang mga desisyon kung ano ang nararapat na maenkodigo bilang isang wika ay ginawa sa loob. Habang maaaring o hindi maaaring tanggapin ang mga ideya mula sa labas, hindi ipinapakita ang pagpapasya mismo, at marami na ang mga dalubwikang sumuko na pabutihin ang pamantayan.
  • Hindi tugma ang permanenteng pagkakakilanlan ng isang wika sa pagbabago ng wika.
  • Madalas na hindi maaaring tiyakin ang paghahati ng mga wika at diyalekto, at maaaring bahaginin ang diyalektong kontinyuwum sa maraming paraan, samantalang isa lamang ang mapipilian bilang pamantayan. Madalas na nakabatay ang mga pagkakakilanlan na ito sa mga salik sa lipunan at pulitika.
  • Maaaring magkamali sa pag-unawa at magmalabis sa ISO 639-3 ang mga awtoridad na gumagawa ng mga desisyon tungkol sa pagkakakilanlan at wika ng mga tao, na buwagin ang karapatan ng mga nagsasalita upang magpakilala o magpakilala sa kanilang baryante ng pagsasalita. Kahit na sensitibo ang SIL sa mga isyung iyon, likas ang problemang ito sa katangian ng isang itinatag na pamantayan, na maaaring gamitin (o gamitin nang mali) sa mga paraan na hindi nilalayon ng ISO at SIL.

Sumasang-ayon si Martin Haspelmath sa apat sa mga puntong ito, ngunit hindi ang punto tungkol sa pagbabago ng wika.[22] Hindi siya sumasang-ayon dahil nangangailangan ang anumang akawnt ng isang wika ng pagkakakilanlan nito, at madali nating makikilala ang iba't ibang yugto ng isang wika. Nagmumungkahi siya na maaaring mas gusto na gumamit ang mga dalubwika ng isang pagkukodigo na ginawa sa antas ng languoid dahil "bihirang bagay sa mga lingguwista kung ang kanilang pinag-uusapan ay isang wika, isang dialect o isang malapit-knit pamilya ng mga wika." Nagdududa rin siya kung angkop ang isang pamantayang ISO para sa pagkilala ng wika dahil isang pang-industriya na samahan ang ISO, habang itinuturing niya ang dokumentasyon ng wika at katawagan bilang isang pang-agham na pagsisikap. Binanggit niya ang orihinal na pangangailangan para sa mga pamantayan ng pagkakakilanlan ng wika bilang pagiging "pang-ekonomikang kahalagahan ng pagsasalin at lokalisasyon ng software," kung saan itinatag ang mga layunin ng mga pamantayan ng ISO 639-1 at 639-2. Subalit siya ay nag-aalinlangan tungkol sa pangangailangan ng industriya para sa komprehensibong sakop na ibinibigay ng ISO 639-3, kasama na ang "mga di-kilalang wika ng mga maliliit na komunidad na hindi kailanman o halos hindi ginagamit sa pagsusulat at kadalasang nasa panganib ng pagkalipol".

Paggamit baguhin

  • Ethnologue
  • Linguist List
  • OLAC: the Open Languages Archive Community[23]
  • Microsoft Windows 8:[24] Sinusuportahan ang lahat ng mga kodigo sa ISO 639-3 noong panahon ng pagpalabas.
  • Pundasyong Wikimedia: Ang mga proyektong nakabatay sa bagong wika (hal.Mga Wikipedia sa mga bagong wika) ay dapat magkaroon ng isang nagkakakilanlan mula sa ISO 639-1, -2, o -3.[25]
  • Iba pang mga pamantayan na umaasa sa ISO 639-3:
    • Mga tag ng wika gaya ng tinukoy ng Internet Engineering Task Force (IETF), tulad ng dokumentado sa:
      • BCP 47: Best Current Practice 47,[26] na kinabibilangan ng RFC 5646
      • RFC 5646, na pumalit sa RFC 4646, na pumalit sa RFC 3066. (Samakatuwid, ang lahat ng mga pamantayan na umaasa sa alinman sa 3 pamantayan ng IETF na ito ngayon ay gumagamit ng ISO 639-3.)
    • Ang pamantayang ePub 3.0 para sa metadata ng wika[27] ay gumagamit ng mga elemento ng Dublin Core Metadata. Dapat maglaman ang mga elemento ng metadata ng wika sa ePubs ng wastong mga kodigo ng RFC 5646 para sa mga wika.[27] Tumuturo sa ISO 639-3 ang RFC 5646 para sa mga wika na walang mas maikli na mga kodigo sa IANA.
    • Dublin Core Metadata Initiative: DCMI Metadata Term [28] para sa wika, sa pamamagitan ng RFC 4646 ng IETF (na pinalitan ngayon ng RFC 5646).
    • Internet Assigned Numbers Authority (IANA) Inirerekomenda ng pagsisikap sa internasyonalisasyon ng W3C ang paggamit ng IANA Language Subtag Registry para sa pagpili ng mga kodigo para sa mga wika.[29] Nakasalalay ang IANA Language Subtag Registry[30] sa mga kodigong ISO 639-3 para sa mga wika na walang mga kodigo sa iba pang bahagi ng pamantayan ng ISO 639 dati.
    • HTML5:[31] sa pamamagitan ng IETF's BCP 47.
    • Mga libreryang kodigo ng MARC.
    • Mga librerayng kodigo ng MODS:[32] Isinasama ang RFC 3066 ng IETF (na pinalitan ngayon ng RFC 5646).
    • Text Encoding Initiative (TEI):[33] sa pamamagitan ng BCP 47 ng IETF.
    • Lexical Markup Framework: Pagtutukoy ng ISO para sa representasyon ng mga diksyunaryong maaaring basahin ng mga makina.
    • Common locale data repository ng Unicode: Gumagamit ng ilang daang mga kodigo mula sa ISO 639-3 hindi kasama sa ISO 639-2.

Mga sanggunian baguhin

  1. 1.0 1.1 "ISO 639-3 status and abstract". iso.org. 2010-07-20. Nakuha noong 2012-06-14.
  2. "Maintenance agencies and registration authorities". ISO.
  3. "Types of individual languages – Ancient languages". sil.org.
  4. Ulat ng Ethnologue para sa ISO 639 code: zho Naka-arkibo 2014-09-12 sa Wayback Machine. sa ethnologue.com
  5. ISO639-3 sa SIL.org
  6. 6.0 6.1 "ISO 639-3 Code Set". Sil.org. 2007-10-18. Nakuha noong 2012-06-14.
  7. "ISO 639-3". sil.org.
  8. "Scope of Denotation: Individual Languages". sil.org.
  9. "Scope of Denotation: Dialects". sil.org.
  10. "Scope of denotation: Macrolanguages". sil.org. Inarkibo mula sa ang orihinal noong 2013-02-08. Nakuha noong 2012-06-14.
  11. "Macrolanguage Mappings". sil.org. Nakuha noong 2012-06-14.
  12. "Scope of denotation: Collective languages". sil.org. Inarkibo mula sa ang orihinal noong 2013-02-08. Nakuha noong 2012-06-14.
  13. Mga Pag-record ng Field ng Vervet Monkey Calls[patay na link] . Ang entry sa catalog ng Linguistic Data Consortium . Nakuha noong 2012-09-04.
  14. "Submitting ISO 639-3 Change Requests: Types of Changes". sil.org.
  15. Morey, Stephen; Post, Mark W.; Friedman, Victor A. (2013). The language codes of ISO 639: A premature, ultimately unobtainable, and possibly damaging standardization. PARADISEC RRR Conference. Inarkibo mula sa ang orihinal noong 2016-02-23. Nakuha noong 2019-03-29.
  16. "Scope of Denotation for Language Identifiers". sil.org.
  17. "Types of Languages". sil.org.
  18. "ISO 639-3 Change Management". sil.org.
  19. "Submitting ISO 639-3 Change Requests". sil.org.
  20. "ISO 639-3 Change Request Index". sil.org.
  21. Morey, Stephen; Post, Mark W.; Friedman, Victor A. (2013). The language codes of ISO 639: A premature, ultimately unobtainable, and possibly damaging standardization. PARADISEC RRR Conference. Inarkibo mula sa ang orihinal noong 2016-02-23. Nakuha noong 2019-03-29.
  22. Martin Haspelmath, "Ang pagkakakilanlan ba ng wika ay pinagtutuunan ? Sa critique ng Morey et al. Ng ISO 639-3" , Diversity Linguistics , 2013/12/04
  23. "OLAC Language Extension". language-archives.org. Nakuha noong 3 August 2015.
  24. "Over 7,000 languages, just 1 Windows".
  25. "Language proposal policy". wikimedia.org. Nakuha noong 3 August 2015.
  26. "BCP 47 – Tags for Identifying Languages". ietf.org. Nakuha noong 3 August 2015.
  27. 27.0 27.1 "EPUB Publications 3.0". idpf.org. Nakuha noong 3 August 2015.
  28. "DCMI Metadata Terms". purl.org. Nakuha noong 3 August 2015.
  29. "Two-letter or three-letter ISO language codes". w3.org. Nakuha noong 3 August 2015.
  30. "Language Registry". Nakuha noong 2015-08-12.
  31. "3 Semantics, structure, and APIs of HTML documents — HTML5". w3.org. Nakuha noong 3 August 2015.
  32. "Elements – MODS User Guidelines: Metadata Object Description Schema: MODS (Library of Congress)". loc.gov. Nakuha noong 3 August 2015.
  33. "TEI element language". tei-c.org. Nakuha noong 3 August 2015.

Karagdagang pagbabasa baguhin

Mga panlabas na link baguhin