Ir al contenido principal

Datos, combustible de la economía digital



“La información es el petróleo de este siglo, 
y la analítica de datos el motor de combustión”.

-Peter Sondergaard.


A mediados de la década de los cincuenta, un grupo de científicos -basados en estudios de Alan Turing-, se propusieron una misión ambiciosa: recrear la inteligencia humana en una máquina. El proyecto atrajo a algunas de las mentes más importantes de la época como, Marvin Lee Minsky y John McCarthy, que pronto pusieron los cimientos para el desarrollo de lo que hoy conocemos como Inteligencia Artificial (IA).

Al principio, el estudio de la IA se dividió en dos enfoques: el primero "basado en reglas" y el segundo en "redes neuronales". Bajo el enfoque de reglas, los investigadores intentaron “enseñar a las computadoras a pensar” codificando una serie de secuencias lógicas: si ocurre X, entonces Y (if–then). Esto funcionó para problemas simples y bien definidos, sin embargo, fue poco efectivo en la medida que se incrementaba el universo de posibles opciones. Para acercarse más a los problemas del mundo real, los investigadores entrevistaron a expertos en los problemas que se estaban abordando, para luego codificar su conocimiento en la toma de decisiones del programa, esto dio lugar a los llamados sistemas expertos que realizan inferencias semejantes a las humanas sobre los conocimientos obtenidos de una base con reglas cognitivas específicas de un campo.

Por su parte, los investigadores con enfoque en "redes neuronales" trataron de reconstruir el cerebro, no con reglas, sino buscando imitar la arquitectura subyacente del cerebro construyendo capas de neuronas artificiales que pueden recibir y transmitir información en una estructura similar a las redes neuronales biológicas que, tomando como base ejemplos (entre más ejemplos mejor), son capaces de identificar patrones. En el contexto de la pandemia generada por el COVID-19, por ejemplo, se generado algoritmos de inteligencia artificial que basados en una radiografía de tórax pueden predecir la presencia o no del virus, esto se logra gracias al “entrenamiento” de los algortimos con millones de imágnes de pacientes con y sin la infección del virus.

Si bien, en sus inicios las redes neuronales artificiales arrojaron resultados prometedores, los investigadores se encontraron con limitantes: las redes neuronales requerían grandes cantidades de datos y mucha potencia informática. No fue sino hasta después de varios años y gracias a los avances tecnológicos en el campo de las comunicaciones y la computación, así como a su bajo costo, que se logró contar con acceso suficiente al insumo esencial de la IA: los datos.

Pero, ¿qué son los datos?. En telecomunicaciones, son cualquier entidad capaz de transportar información[1], la cual puede ser transmitida en conjuntos de caracteres que se recopilan y traducen para algún propósito y pueden representar texto, números, imágenes, sonidos o videos.

Los datos son imprescindibles en el desarrollo de la IA y su utilidad está creciendo constantemente ya que se pueden aplicar para mejorar las experiencias en todos los ámbitos del quehacer humano. Su utilización está impulsando, por ejemplo, tendencias como edificios, ciudades y manufactura inteligentes, que utilizan nuevas tecnologías como la quina generación de servicios móviles (5G) y el Internet de las cosas (IoT), para generar y recopilar una gran cantidad de datos.

Hoy en día, los datos pueden ser recolectados, almacenados, procesados y visualizados a tasas de velocidad y capacidad sin precedente. A nivel mundial, internet genera trillones de bits diariamente, en forma de mensajes de Twitter, fotos de Snapchat, videos de Youtube, llamadas en Skype, viajes en Uber, búsquedas en Google, consultas en Weather Channel, cámaras de seguridad, semáforos, sensores ubicados en campos agrícolas, correo electrónicos, entre muchos otros. Toda esta información da forma a lo que se conoce como Big Data cuyas características principales, según Douglas Laney, son: volumen, velocidad y variedad.

El aumento de conectividad y sistemas de análisis ha establecido las condiciones para el aprovechamiento del Big Data, cuyo potencial es reconocido por los líderes empresariales, académicos y de gobierno alrededor del mundo, no solo para impulsar la innovación, promover el comercio e impulsar el progreso, sino también para permitir a los usuarios aprovechar de manera más efectiva las oportunidades de la economía digital. 

Las principales organizaciones ya examinan y procesan grandes cantidades de datos, buscando la forma de entender mejor a sus clientes, mejorar sus operaciones, superar a sus competidores y de posicionarse mejor en el mercado. En resumen, el manejo de los datos contribuye a la competitividad de las organizaciones y de los países.

De acuerdo con el reporte Shifting toward Enterprise-grade AI[2], estudios recientes apuntan al aumento acelerado de los datos como el principal desafío de los ejecutivos. Las organizaciones están intentando obtener la esencia de la información, en 1´s y 0´s (unos y ceros), de cada transacción, consulta e interacción humana. Cada búsqueda en Internet, mensaje enviado, canción escuchada o imagen compartida, genera datos y tiene el potencial de permitir, a quienes los poseen, un mayor conocimiento de los usuarios y en consecuencia podría satisfacer de mejor manera sus necesidades o incluso orientar las decisiones y comportamientos.

Lo anterior es un ejemplo del uso dual que pueden darse a los avances tecnológicos y nos lleva a reflexionar:¿Quién es dueño de todos los datos que se generan? ¿Cómo podemos aprovechar la tecnología sin vulnerar nuestra privacidad? ¿Quién gestiona la propiedad de los datos?

Pensemos, por ejemplo, en los datos clínicos de pacientes que pueden llevar a los médicos a diagnosticar y tratar a los pacientes en lo individual, incluso a obtener patrones que permitan a las autoridades emprender acciones preventivas de salud en una determinada localidad. Sin embargo, debemos reconocer que existe el riesgo de que estos mismos datos sean manipulados por aseguradoras o farmacéuticas para maximizar los beneficios de sus productos o para restringir el acceso a determinadas personas. En la emergencia sanitaria generada por el COVID-19, las aplicaciones para el rastreo de contactos han generado polémica respecto al balance que debe existir en el control de una emergencia sanitaria y la privacidad.

No cabe duda que el uso de datos está revolucionando todos los ámbitos del quehacer humano: salud, educación, agricultura, comercio, entre muchos otros. Pero esta información debe ser transmitida y utilizada de manera adecuada, protegiendo en todo momento la privacidad de las personas.

Retomando a Peter Sondergaard, bien podríamos concluir que si “la información es el petróleo de este siglo y la analítica de datos el motor de combustión”, las redes de telecomunicaciones son los “datoductos” que permiten su transporte y aprovechamiento. Así, para ser competitivos en la economía digital y no ser solamente importadores de algoritmos se debe seguir fortaleciendo al sector telecomunicaciones como requisito indispensable para el desarrollo del ecosistema digital en México.

Figura 1. "Datos, el nuevo petróleo" 



Twitter: @juarezmojica



REFERENCIAS

[1] Stallings, W, Comunicaciones y Redes de Computadoras, 7ª edición, Pearson Educación, S.A., Madrid, 2004.


[2]IBM Institute for Business value, Shifting toward Enterprise-grade AI. USA, 2019, Disponible en https://public.dhe.ibm.com/common/ssi/ecm/26/en/26017626usen/26017626usen-02_26017626USEN.pdf

Comentarios

Entradas populares de este blog

Números de Vanidad

Si leyeron el título y pensaron que les daría el directorio telefónico de los “top-ten” salones de belleza, se equivocan, no me refiero a los números telefónicos para la vanidad, pero si quieren saber a qué me refiero sigan leyendo. Los números telefónicos de vanidad son conocidos en el Plan Técnico Fundamental de Numeración como números no geográficos específicos y se definen como aquellos “cuyo número de usuario tenga una preferencia en el orden de los dígitos o en su significado” . Lo que el Plan quiere decir, es que se trata de números con los que se puede formar una palabra relevante para quien lo contrata, y aplica para números 800, sin cargo para el usuario que realiza la llamada, o números 900 con cargo adicional, como en sorteos. 1 2 ABC 3 DEF 4 GHI 5 JKL 6 MNO 7 PQRS 8 TUV 9 WXYZ * 0 #       La tabla anterior muestra un teclado telefónico convencional, a cada número
  A.  Algoritmos en la gestión pública.   Si algo nos enseñó la pandemia, es que la transformación digital es inaplazable y esencial. Como administración pública, no podemos darnos el lujo de mantenernos al margen de incorporar los adelantos tecnológicos a nuestros procesos; de hecho, deberíamos ser un catalizador para fomentarlos y con ello reducir los tiempos de atención a la ciudadanía, generar ahorros, fomentar la toma de decisiones objetivas -con datos- y aumentar la transparencia.   Al respecto, vale la pena reconocer que la Constitución Política de la Ciudad de México es innovadora en la incorporación de ciertos conceptos. Por ejemplo, establece el derecho a la buena administración pública (Art. 7º): “ Toda persona tiene derecho a una buena administración pública, de carácter receptivo, eficaz y eficiente, así́ como a recibir los servicios públicos de conformidad con los principios de generalidad, uniformidad, regularidad, continuidad, calidad y  uso de las tecnologías de la inf

Multiprogramación en la televisión digital

Una de las ventajas indiscutibles de la Televisión Digital Terrestre (TDT,) es el uso más eficiente del espectro radioeléctrico ya que permite, por ejemplo, que por el mismo ancho de banda que antes se transmitía solamente un programa en formato analógico, ahora se puedan transmitir hasta 6 en formato digital (la cantidad de canales dependerá del sistema de compresión –MPEG-2, MPEG-4 -). Señalar que en televisión digital se hace un uso más eficiente del espectro radioeléctrico puede conducir a la errónea apreciación de que, para transmitir un canal de televisión en dicho formato, se requiere menos espectro, cosa que no es así y para explicarlo es necesario entender primeramente lo que es el multiplexeo. El diccionario de la Real Academia Española (RAE) propone la siguiente redacción para el término multiplexor: “Dispositivo que permite transmitir varias señales independientes por el mismo canal.” Como se desprende de la definición de la RAE, el concepto de multiplexeo está est