Investigadores y estudiantes del Seminario de Lingüística Forense, de la licenciatura en Ciencia Forense de la Facultad de Medicina (FM) de la UNAM, constituyeron el Corpus de Lengua Oral del Español (CLOE), cuyo objetivo es realizar investigación en comparación forense de voz, a fin de analizar llamadas de extorsión o secuestro, por ejemplo, y en el desarrollo de investigaciones en lingüística.
CLOE está conformado con esos elementos e integra muestras de voz de habitantes de todas las regiones del país, lo que será de utilidad en la caracterización de la voz al analizar llamadas de extorsión o secuestro, y también en el desarrollo de investigaciones en lingüística.
El proyecto consiste en grabar, en una cabina insonorizada (aislada de ruido), las voces de personas (voluntarias) que desean participar en la investigación con el registro de su voz.
A diferencia de instrumentos similares a cargo de instituciones de procuración e impartición de justicia del país, los cuales están constituidos por voces de indiciados, procesados y sentenciados por algún delito, la herramienta universitaria en construcción permanente es también un recurso de utilidad para áreas de la lingüística dedicadas al estudio del español de México.
De acuerdo con Fernanda López Escobedo –quien dirige el equipo de investigación–, CLOE también es de utilidad en temas de procesamiento de lenguaje natural, para realizar reconocimiento y síntesis de voz, entre otros ámbitos. “En realidad nuestro objetivo es con un fin forense, sin embargo, es de interés para otras especialidades”.
Expuso que se requiere utilizar el conocimiento desarrollado en investigaciones lingüísticas relacionadas con el español de México, sobre sus diferentes acentos y modismos para aplicarlo al ámbito de la lingüística forense. Además, es importante mantener actualizadas dichas investigaciones que en muchos casos requieren de un banco de voces o corpus (conjunto extenso y estructurado de ejemplos reales de uso de la lengua) de hablantes mexicanos de diversos rangos de edad y con distintas características socioeconómicas.
En el ámbito académico existen otros esfuerzos como el corpus sociolingüístico de la Ciudad de México, de El Colegio de México, uno de los más utilizados en investigación lingüística. Sin embargo, ninguno está enfocado ni recopilado específicamente para el ámbito forense.
Destacó que hasta antes de la pandemia tenían 145 hablantes grabados divididos en tres grupos de edad y tres niveles de estudios –entre los que se pueden medir, por ejemplo, diferencias en variables como riqueza léxica–, así como en hombres y mujeres, a fin de buscar representatividad del español de México.
“No hemos podido continuar con la recopilación de voces, por las medidas sanitarias instituidas por la pandemia, porque se requiere utilizar la cabina, que es un espacio cerrado, pero tampoco podríamos dejar que el hablante utilice cubrebocas, pues es un factor de variabilidad en la voz”, enfatizó.
Al abundar sobre el trabajo que realizan, López Escobedo subrayó que están segmentando las 145 voces por fonemas, principalmente los sonidos vocálicos (vocales), porque son los más útiles para extraer características acústicas y aplicarlas en la comparación forense de voz.
Para la experta, en México hacen falta bases de datos en las ciencias forenses porque muchas áreas como la de análisis de voz comparan características o un patrón de una muestra dubitada (que no se sabe a quién pertenece), contra una indubitada (cuyo autor es conocido); “necesariamente lo tienen que hacer a partir del conocimiento de la frecuencia de esa característica en una población”.
Al continuar, comenta que no se puede afirmar que sí se parecen solo porque coincide la característica, es necesario determinar si esa coincidencia se debe a que se trata de la misma persona o porque la comparten, porque ambas hablan el mismo idioma o sociolecto (forma de hablar de las personas que pertenecen a un mismo grupo social).
De ahí la necesidad de bases de datos de lengua oral, aunque ocurre lo mismo en otras áreas como dactiloscopia, genética y odontología, ciencias que necesariamente compararan características y obtienen la frecuencia de éstas en la población.
Indicó que la intención del grupo de investigación es continuar con el corpus una vez que las condiciones de la emergencia sanitaria lo permitan; mientras más datos reunamos, mayor certeza tendremos con los métodos que estamos desarrollando.
Voz y prótesis
Los universitarios conformaron otro corpus relacionado con el habla de adultos mayores con prótesis dental, pues hay rubros que no han sido suficientemente explorados por el mundo forense, los cuales permitirían caracterizar a un individuo por el uso o no de esos dispositivos.
Detalló que las características acústicas de quienes utilizan implantes dentales se modifican, sobre todo en la producción de ciertos sonidos que involucran el sitio de la boca donde tiene la prótesis; el objetivo es determinar qué variaciones sufren los sonidos, por ejemplo el de la letra “s”, uno de los más involucrados en esa parte de la anatomía.
Para este trabajo el Seminario de Lingüística Forense labora junto con el área de odontología forense de la Licenciatura en Ciencia Forense y cuenta con el apoyo y colaboración de la División de Estudios de Posgrado e Investigación de la Facultad de Odontología UNAM, donde acuden pacientes que requieren o usan estos aditamentos y que voluntariamente deciden participar en este proyecto mediante consentimiento informado previo.