Los nombres de los organismes biológicos: consecuencias terminológicas de un uso massivo en Internet
14/11/2017
A grandes rasgos, de organismos vivos de todo tipo se calcula que se han descrito casi un millón y medio de especies (de las cuales un millón son animales), y pueden haber casi once millones de especies, tanto en el mar como en los continentes, sin descripción válida ni nombre en el Código Internacional de Nomenclatura Zoológica. Si los efectos de la pérdida de biodiversidad no nos ahorran el trabajo, tenemos por delante el reto de dar nombre a 10 millones de especies. ¿Pueden los medios actuales de comunicación entorpecer o facilitar este trabajo? O, en otros términos, ¿cómo puede la era digital colaborar al conocimiento y la preservación del medio natural?
Es evidente que nos encontramos delante de una empresa colosal ante la cual hay que activar tanto recursos como ideas. Pero no es de eso exactamente de lo que se quiere hablar en esta charla, sino del problema que representa gestionar un vocabulario de más de un millón de términos que llevan asociada una información rica y práctica. Rica por el valor científico que transmiten los nombres científicos y práctica porque la actividad humana a menudo se fía del buen uso de estos nombres en distintos ámbitos de su actividad: comercial, farmacológica, industrial, ocio, etc.
Los científicos se convierten en los primeros usuarios de este universo de nomenclatura y exigen certezas sin impedir el lógico debate científico que pueda actualizar la propia organización del sistema de clasificación y nomenclatura. Redundancia, ambigüedad, sinonimia, validación… son conceptos que forman parte de las plataformas que se van construyendo en Internet para facilitar una especie de gobierno mundial de la nomenclatura biológica. Argumentos tecnológicos y científicos van en paralelo para perfilar las herramientas que han de permitir recorrer a diversas fuentes de información para sumar datos hábiles y suficientes para analizar fenómenos naturales consumidores de grandes tablas de información.
Conceptos propios ahora de las tecnologías de la información con documento enlazado (linked data), datos abiertos (open data) y el majestuoso big data, un término resistente a ser traducido, suponen la generalización de los consumos de enormes cantidades de información construidas a menudo a partir de muy diversas fuentes que son explotadas de forma rápida para consultores expertos e inexpertos. La provisión de datos y su consumo se hacen a grandes velocidades y el control de la información se debilita. Por esta razón los proveedores de información y las plataformas de agregación de datos son dos estadios del sistema donde hay que invertir esfuerzos para garantizar un buen uso de la información suministrada. El usuario suele estar captivado por la precipitación del fácil acceso de datos y a menudo no las contrasta.