Idiolecto - Idiolect

Idiolect es el uso único del lenguaje por parte de un individuo , incluido el habla. Este uso único abarca vocabulario , gramática y pronunciación .

Un idiolecto es la variedad de lenguaje única de un individuo. Esto difiere de un dialecto , un conjunto común de características lingüísticas compartidas entre un grupo de personas.

El término está relacionado etimológicamente con el prefijo griego idio- (que significa "propio, personal, privado, peculiar, separado, distinto") y -lecto , abstraído del dialecto y, en última instancia, del griego antiguo λέγω , légō , 'hablo'.

Idioma

El lenguaje consta de construcciones de oraciones, elección de palabras y expresión de estilo. Mientras tanto, un idiolecto es el uso personal que hace un individuo de estas facetas. Cada persona tiene un idiolecto único en función de su idioma, nivel socioeconómico y ubicación geográfica. La lingüística forense analiza psicológicamente los idiolectos.

La noción de lenguaje se utiliza como una descripción abstracta del uso del lenguaje y de las habilidades de los hablantes y oyentes individuales. Según este punto de vista, una lengua es un "conjunto de idiolectos ... más que una entidad per se". Los lingüistas estudian idiomas particulares examinando las expresiones producidas por hablantes nativos.

Esto contrasta con la opinión de los no lingüistas, al menos en los Estados Unidos, de que los lenguajes como sistemas ideales existen fuera de la práctica real de los usuarios del lenguaje: con base en el trabajo realizado en los EE. UU., Nancy Niedzielski y Dennis Preston describen una ideología del lenguaje que parece para ser común entre los hablantes de inglés americano. Según Niedzielski y Preston, muchos de sus sujetos creen que hay un patrón "correcto" de gramática y vocabulario que subyace al inglés estándar , y que el uso individual proviene de este sistema externo.

No obstante, los lingüistas que entienden idiomas particulares como una combinación de idiolectos individuales únicos deben tener en cuenta el hecho de que los miembros de grandes comunidades de habla , e incluso los hablantes de diferentes dialectos del mismo idioma, pueden entenderse entre sí. Todos los seres humanos parecen producir el lenguaje esencialmente de la misma manera. Esto ha llevado a búsquedas de gramática universal , así como a intentos de definir mejor la naturaleza de idiomas particulares.

Lingüística forense

La lingüística forense incluye intentos de identificar si una persona produjo un texto dado comparando el estilo del texto con el idiolecto del individuo en cuestión. El lingüista forense puede concluir que el texto es coherente con el individuo, descartar al individuo como autor o considerar que la comparación no es concluyente.

En 1995 Max Appedole se basó en parte en un análisis del estilo de escritura de Rafael Sebastián Guillén Vicente para identificarlo como el subcomandante Marcos , un líder del movimiento zapatista . Aunque el gobierno mexicano consideraba al subcomandante Marcos como un guerrillero peligroso, Appedole convenció al gobierno de que Guillén era un pacifista. El análisis de Appedole se considera un éxito temprano en la aplicación de la lingüística forense a la elaboración de perfiles criminales en la aplicación de la ley.

En 1998, Ted Kaczynski fue identificado como el "Unabomber" por medio de la lingüística forense. El FBI y la procuradora general Janet Reno presionaron por la publicación de un ensayo de Kaczynski, lo que llevó a un soplo del hermano de Kaczynski, quien reconoció el estilo de escritura, su idiolecto.

En 1978, cuatro hombres fueron acusados ​​y condenados por asesinar a Carl Bridgewater . En ese momento, no hubo lingüística forense involucrada en su caso. Hoy en día, la lingüística forense refleja que el idiolecto utilizado en la entrevista de uno de los hombres era muy similar a la declaración informada por ese hombre. Dado que los idiolectos son exclusivos de un individuo, la lingüística forense refleja que es muy poco probable que uno de estos archivos no se haya creado utilizando el otro.

Detectando idiolecto con corpora

El análisis de idiolecto es diferente para un individuo dependiendo de si los datos que se analizan provienen de un corpus compuesto íntegramente por textos o archivos de audio, ya que el trabajo escrito está más pensado en la planificación y es más preciso en la redacción que en el habla espontánea, donde el lenguaje informal y la conversación rellenos (es decir, umm ..., ya sabes, etc.) llenan muestras de corpus. Los corpus con grandes cantidades de datos de entrada permiten la generación de frecuencia de palabras y listas de sinónimos, normalmente mediante el uso de los diez bigramas principales creados a partir de ellos (aquí se tiene en cuenta el contexto del uso de palabras, al determinar si un bigrama es legítimo en ciertos casos). circunstancias).

Si una palabra o frase es parte de un idiolecto está determinado por dónde está la palabra en comparación con la palabra principal de la ventana , el borde de la ventana. Esta ventana se mantiene en 7-10 palabras, con una muestra que se considera como una característica del idiolecto posiblemente a + 5 / -5 palabras de la palabra "principal" de la ventana (que normalmente está en el medio). Los datos del corpus pertenecientes al idiolecto se clasifican en tres categorías: irrelevantes, marcadores personales del discurso y vocabulario informal. Las muestras que se encuentran al final del cuadro y lejos de esta palabra principal a menudo se descartan como superfluas. Los datos superfluos luego se ejecutan a través de funciones diferentes a los datos no superfluos para ver si esta palabra o frase es parte del idiolecto de un individuo.

Ver también

Referencias

enlaces externos