Decodificación y transliteración

 

 

 

       

 

       

 

 

 
 

 

El decodificador de imTranslator

soluciona problemas relacionados

con la visualización incorrecta de los caracteres rusos

en correos electrónicos, páginas web, etc.,

como se ve en la imagen de la derecha.

 

Además, el decodificador incluye

un módulo de transliteración,

que puede representar el texto ruso

con carácteres latinos (transliterados)

a fin de facilitar la transmisión

de mensajes rusos vía el Internet.

 

Transliterar es

representar los signos

de un sistema de escritura

mediante los signos de otro.

 

Traductor de idiomas 

 

 

 
   
     

Información general sobre códigos y transliteraciones

Juan Carlos Murillo Ch.

   

 

   

 

 

Códigos de caracteres

 

La codificación de caracteres es el método que permite convertir un caracter  (letra, número...) de un alfabeto en un símbolo de otro sistema de representación.  Por ejemplo, el código Morse le dió a las letras diversas equivalencias en impulsos eléctricos.

 

Códigos informáticos

 

Hay una gran variedad de codificaciones de alfabetos para las computadoras. A continuación se destacarán algunos sistemas de codificación informática.

 

 

ASCII (se pronuncia ASKI)

Fue creado en 1963 por el Comité Estadounidense de Estándares (ANSI) como una evolución de los estándares utilizados entonces en telegrafía.

 

El código ASCII utiliza 7 bits, por lo que puede representar solo 128 caracteres, lo cual generó grandes limitaciones, pues no incluía letras del español como las vocales tildadas y la eñe. Lo mismo con otras letras latinas como ê - è.  Desde luego no tenía capacidad para otros idiomas como el ruso, el chino, árabe, etc.

 

Se crearon diversas ampliaciones para subsanar sus límites.  Esto generó caos, al no existir un único estandar.

 

 

Unicode

Como solución a esos problemas, desde 1991 se acordó internacionalmente utilizar la norma Unicode, que es una gran tabla. Esta asigna un código a cada uno de los más de cincuenta mil símbolos comprendidos en todos los alfabetos europeos, ideogramas chinos, japoneses, coreanos, muchas otras formas de escritura, y más de un millar de símbolos especiales.

 

UTF-8

Es una norma de transmisión de datos de Internet utilizada junto con la codificación Unicode. Agrega poderosas funciones para el intercambio de documentos.

 

Este es el mejor sistema para codificar emails, páginas web, etc., cuando se comunican personas con diferentes idiomas como el ruso, inglés y español.

 

 

En el Internet Explorer elija el UTF-8 con la siguiente ruta:

Menú Ver - Codificación - Unicode (UTF-8)

 

 

Codificaciones rusas

 

Si bien el UTF-8 vino a resolver los enormes problemas de comunicación entre ciudadanos de diversas lenguas, ha tardado en convertirse en un estandar a nivel mundial.  Una gran consolidación de este código se dio cuando Windows XP lo incorporó en su sistema operativo.

 

Aún hoy se usan muchos otros sistemas de codificación de letras.  En el caso de los rusos esto es un serio problema pues existen varias populares codificaciones usadas para comunicarse en este idioma, lo que genera varios errores en los caracteres cuando no se usa el mismo código.

 

Dentro de los sistemas de codificación rusos más usados están:

  • Cyrillic (ISO) - ISO-8859-5
  • Cyrillic (KOI8-R) - KOI8-R
  • Cyrillic (KOI8-U) - KOI8-U
  • Cyrillic (Windows) - Windows-1251

 

Romanización del Idioma Ruso

 

Existen muchos sistemas posibles para transliterar el alfabeto cirílico (ruso) al alfabeto latino y al inglés. Tales transliteraciones son necesarias para escribir nombres rusos y otras palabras en el alfabeto propio.

 

La romanización también es esencial para introducir texto ruso en computadoars, por parte de usuarios que, o bien no disponen de teclado cirílico, o bien no son capaces de teclear rápidamente en un teclado con distribución cirílica.

 

La transliteración también tiene un propósito didáctico para hablantes de lenguas escritas con el alfabeto latino, como también lo es para rusos que aprenden los alfabetos latinos.

 

 

Transliteraciones sistemáticas de Cirílico a Latino

 

Transliterar es representar los signos de un sistema de escritura mediante los signos de otro.

Los sistemas de transliteración fonética están pensados para lectores de una lengua en particular, ya que las letras del alfabeto latino son distintas y se emplean de forma distinta en cada lenguaje. Por ejemplo, la palabra rusa "Воронин“ = “Voronin” en inglés, «Voronine» en francés y „Woronin“ en alemán.

 

Transliteración académica

La transliteración científica, también conocida como Sistema Internacional Académico, es un sistema que ha sido empleado en lingüística desde el siglo XIX. Está basado en el checo y el alfabeto croata, y sirvió de base para los sistemas GOST e ISO.

 

GOST 16876 (1971)

Desarrollado por la Administración Nacional para la Geodesia y Cartografía del Consejo de Ministros de la URSS, GOST 16876-71 ha estado en servicio durante más de 30 años y es el único sistema de romanización que no emplea diacríticos. Fue reemplazado por el GOST 7.79-2000.

 

GOST ST SEV 1362 (1978)

Este estándar es el equivalente de GOST 16876-71. Fue adapatado como estándar oficial del COMECON.

 

GOST 7.79 (2002)

GOST 7.79-2000 Sistemas de Estándares en la información, biblioteconomía y publicación - reglas para la transliteración de carácteres cirílicos usando el alfabeto latino es el documento más reciente sobre transliteración en la serie de GOST standards. Este estándar es la adopción de ISO 9:1995 y es ahora el estándar oficial de Rusia.

 

ISO/R 9

ISO/R 9, establecido en 1954 y actualizado en 1968, fue la adopción de la transliteración científica por la Organización Internacional de Estandarización (ISO). Cubre el ruso y otras siete lenguas eslavas.

 

ISO 9

ISO 9:1995 es el estándar de transliteración que está en vigor. Está basado en su predecesor ISO/R 9:1968, al cual sustituye. En cuanto al ruso, sólo difieren en el tratamiento de tres letras. Es el primer sistema independiente del lenguage, unívoco con un carácter para cada letra (ayudándose del empleo de diacríticos), el cual representa fielmente el original y permite la transliteración inversa para textos cirílicos en cualquier lengua contemporánea

 

Sistema de Romanización de las Naciones Unidas

El UNGEGN, un grupo de trabajo de Naciones Unidas, recomendó en 1987 un sistema de romanización para nombres geográficos, el cual estaba basado en de GOST 16876-71. Todavía puede ser encontrado en algunos productos internacionales de cartografía.

 

ALA-LC

Las tablas de romanización para alfabetos eslavos (1997) de la American Library Association & Library of Congress (ALA-LC) son empleadas en las bibliotecas estadounidenses.

La versión formal y no ambigua del sistema requiere el uso de algunos diacríticos y caracteres que enlazan dos letras, los cuales suelen ser omitidos en la práctica.

 

BGN/PCGN

El sistema BGN/PCGN es relativamente intuitivo de leer y pronunciar. En muchas publicaciones se utiliza una forma simplificada del sistema para crear versiones inglesas de nombres rusos, por ejemplo convirtiendo ë en yo, simplificando las terminaciones -iy e -yy en -y, y omitiendo los apóstrofes para ъ and ь. Puede ser generado empleando únicamente las letras básicas y la puntuación encontrada en los teclados de distribución anglosajona, pues no se requiere el uso de diacríticos. Sin embargo, el caracter interpunto (·) puede ser utilizado para evitar ciertas ambigüedades.

Este estándar en particular es parte del sistema de romanización BGN/PCGN, que fue desarrollados por la Oficina Estadounidense de Nombres Geográficos. La parte del sistema relativa a la lengua rusa fue adoptada por el BGN en 1944 y por el PCGN en 1947.

 

 

Tabla de transliteración de los caracteres del idioma ruso.

 

Cirílico

Académica

ISO/R 9:1968

GOST 1971

ONU

ISO 9:1995; GOST 2002

ALA-LC

BGN/PCGN

А а

a

a

a

a

a

a

a

Б б

b

b

b

b

b

b

b

В в

v

v

v

v

v

v

v

Г г

g

g

g

g

g

g

g

Д д

d

d

d

d

d

d

d

Е е

e

e

e

e

e

e

e, ye

Ё ё

ë

ë

yo

ë

ë

ë

ë, yë †

Ж ж

ž

ž

zh

ž

ž

zh

zh

З з

z

z

z

z

z

z

z

И и

i

i

i

i

i

i

i

Й й

j

j

j

j

j

ĭ

y

К к

k

k

k

k

k

k

k

Л л

l

l

l

l

l

l

l

М м

m

m

m

m

m

m

m

Н н

n

n

n

n

n

n

n

О о

o

o

o

o

o

o

o

П п

p

p

p

p

p

p

p

Р р

r

r

r

r

r

r

r

С с

s

s

s

s

s

s

s

Т т

t

t

t

t

t

t

t

У у

u

u

u

u

u

u

u

Ф ф

f

f

f

f

f

f

f

Х х

x

ch

x

h

h

kh

kh

Ц ц

c

c

  cz, c †

c

c

ts

ts

Ч ч

č

č

ch

č

č

ch

ch

Ш ш

š

š

sh

š

š

sh

sh

Щ щ

šč

šč

shh

šč

ŝ

shch

shch

Ъ ъ

"

"

"

"

"

  " *

"

Ы ы

y

y

y'

y

y

y

y

Ь ь

'

'

'

'

'

'

'

Э э

è

ė

è

è

è

ė

e

Ю ю

ju

ju

yu

ju

û

iu

yu

Я я

ja

ja

уа

ja

â

ia

ya

 

Notas

* ALA-LC: ъ no se representa a final de palabra.

 

BGN/PCGN: ye y sirven para indicar la iotificación inicial de palabra, y tras una vocal, й, ъ, o ь.

 

GOST 7.79-2000: Se recomienda emplear C antes de I, Е, Y, J y CZ en todos los demás casos.

 

** GOST 7.79-2000: La і cirílica en ucraniano y búlgaro se translitera siempre por la letra latina i, de la misma forma que en textos del Ruso Antiguo y Búlgaro antiguo, donde se suele encontrar entre vocales. En casos extraños, en los que aparece ante una consonante (como en мiрь) se translitera por i'.

 

     
         
   

 
 
   
         
 

Inicio  -  Artesanias  -  Bebidas  -  Dulces -  Salados

Blog de noticias y recetas  -  Downloads  -  Crucigrama

Talleres de Pintura de Matrioshkas.

 

Beriozka es una marca registrada.  

Las ilustraciones son originales y están protegidas legalmente.

Sitio Web hecho por Juan Carlos  Murillo Ch. Mayo 2007.