Tweets indígenas - Indigenous Tweets

Captura de pantalla de la página de inicio de los tweets indígenas en abril de 2011

Los Tweets indígenas es un sitio web que registra mensajes de Twitter en idiomas minoritarios para ayudar a los hablantes indígenas a comunicarse entre sí. Fue fundada en marzo de 2011 por Kevin Scannell , quien realiza investigación en lingüística computacional en el Departamento de Matemáticas y Ciencias de la Computación de la Universidad de Saint Louis en St. Louis, Missouri , Estados Unidos. El propósito del sitio web es permitir que los hablantes de lenguas minoritarias se comuniquen en Internet.

En su página de inicio, el sitio web muestra una lista de idiomas minoritarios que ha almacenado en caché. Después de seleccionar un idioma, el usuario pasa a una mesa de todos los que twittean en ese idioma. Los tweets indígenas proporcionan la imagen de perfil de cada usuario de Twitter y estadísticas sobre el número de seguidores de cada persona. Además de proporcionar estadísticas sobre el porcentaje de tweets que una persona escribe en diferentes idiomas, Ind Indian Tweets tiene una selección de los temas de tendencia en los distintos idiomas minoritarios.

Historia

Al inicio del sitio web en marzo de 2011, catalogó 35 idiomas. El 16 de abril de 2011, registró tweets en 76 idiomas minoritarios. Para el 26 de abril de 2011, el sitio web respaldaba 82. Los idiomas catalogados incluyen el gamilaraay "esotérico" y el "más conocido" criollo haitiano y vasco , que tienen el primer y segundo tweeters, respectivamente. El galés ocupa el tercer lugar en los tweets indígenas.

Kapampangan , que ocupó el séptimo lugar en la última semana de abril de 2011, fue el primer idioma filipino admitido por el sitio web.

Procesamiento de datos

Mucha gente mira, con cierta inquietud, la tecnología y cosas como la traducción automática y las redes sociales porque sienten que va a promover los idiomas globales, la cultura estadounidense y la cultura del idioma inglés. Veo cosas como Twitter y las redes sociales como una oportunidad para idiomas más pequeños. Un sitio como los Tweets indígenas es un buen ejemplo de un sitio web que permite a las personas conectarse, comunicarse y utilizar su idioma de forma natural en línea.

Kevin Scannell, abril de 2011

Los tweets indígenas emplean un banco de datos de palabras y frases de los idiomas minoritarios para localizar a las personas que hablan esos idiomas. En una entrevista de abril de 2011 con BBC News , Scannell dijo que ha pasado 8 años construyendo un banco de datos de alrededor de 500 idiomas revisando blogs, periódicos y sitios web.

Los tweets indígenas recopilan datos a través de la API de Twitter mediante la búsqueda en un banco de datos de palabras y frases de los idiomas minoritarios. El motor de búsqueda del sitio web no puede descifrar el idioma de un tweet cuando una palabra está en más de un idioma. Para evitar este enigma, Scannell ingresa palabras que son exclusivas del idioma.

Referencias

enlaces externos