Es un tema que está empezando a ser recurrente. Existe una enorme tensión en muchos medios de noticias, que ven cómo cada día se publica más y más deprisa (con lo que se va complicando lo de marcar correctamente la metadata de cada artículo en el proceso de publicación) y al mismo tiempo cada día es más difícil de justificar la presencia de más documentalistas que hagan el trabajo a posteriori (“con la que está cayendo…” me dicen).

Hay otra tendencia que se puede aprovechar y que no es tan difícil: existe la tecnología para convertir el marcado y rellenado de la metadata en una tarea automatizada. Según avanza el tiempo, yo sigo viendo documentalistas en las empresas de medios, pero no gente que se dedica a marcar artículos uno por uno, de forma tediosa, corrigiendo lo que un periodista con prisa por publicar ha editado un rato antes.

Los documentalistas del futuro no afinarán la metadata de la noticia directamente poniendo las marcas a mano. En vez de eso estarán afinando la máquina para que la categorización y marcado de las noticias sea automática y esté bien hecha. Marcándole criterios al motor lingüístico para ir mejorando el proceso automático cada día, poco a poco. Y multiplicando el número de marcas (y la calidad de las mismas).

Ese contenido bien marcado y bien categorizado es la base de la web lingüística, y es también la base para crear aplicaciones ricas con el contenido.