Author Profiling es una metodología de análisis de textos en formato digital para descubrir ciertas características de sus autores.

Desde que la literatura se estudia en las universidades, se hacen ejercicios para la identificación de autores, estilos, épocas, etc., a partir de textos descontextualizados y sin firma. Se analizan recursos literarios, métricas, giros, vocabulario, temas y contenidos. Así los estudiantes aprenden a reconocer propiedades estilísticas, tendencias, autores, etc., y fijan las corrientes literarias y características de las obras analizadas. Lo mismo se hace en otras ramas de la creación artística. Hoy en día, las máquinas también aprenden a hacerlo con Inteligencia Artificial.

En el Master de Big Data Analytics de la Universitat Politècnica de València se trabaja algo parecido y distinto a la vez: los problemas de Author Profiling en entornos de datos masivos. Es decir la metodología de análisis de textos para tratar de descubrir las características de los autores (por ejemplo, edad, sexo,  rasgos de personalidad, idioma nativo o variedad dialectal del idioma, etc.) basadas en características estilísticas y de los contenidos tratados.

Esto puede tener múltiples utilidades. Un ejemplo es el interés de las marcas comerciales de tener el perfil sociológico de sus usuarios y consumidores.

En este master, bajo la dirección de Francisco Rangel, director de tecnología de autoritas, el alumno Òscar Gàribo ha presentado su trabajo final de máster «Frequency Analysis Interpolation (FAI) – Un método de Representación de Textos de Baja Dimensionalidad para Problemas de Author Profiling en Entornos Big Data«. Mediante el método FAI, Gàribo consigue obtener resultados competitivos en diferentes tareas de Author Profiling en idiomas como el árabe, español, inglés, portugués, y ruso. Además consigue una posición entre los mejores 10 sistemas presentados a la tarea de detección de odio contra inmigrantes y mujeres HatEval de SemEval’19, tanto en inglés como en español. Gàribo está en estos momentos trabajando en la publicación de su investigación en la conferencia CLEF (Conference and Labs of the Evaluation Forum).