La ciencia de datos y la privacidad de datos trabajan de la mano para mejorar el mundo


Este weblog proviene de Amber Yandow, experta en la materia de ciencia de datos, entrenadora, mentora e instructora, que ha trabajado con Cisco para desarrollar Introducción a la ciencia de datos currículo, ahora disponible de forma gratuita en Expertise for All de Cisco Networking Academy. Puede obtener más información sobre el viaje de Amber en la repetición de Girls Rock-IT de “¿Qué tiene de emocionante la ciencia de datos?” . Amber se une a las 23:14.

Una foto de Amber Yandow
Amber Yandow, experta en la materia de ciencia de datos

Como científico de datos, mi trabajo es analizar datos para ayudar a resolver problemas. Y a medida que el mundo se digitaliza, no solo con dispositivos móviles, sino también con sensores y otras tecnologías IoT (Web de las cosas) como dispositivos portátiles, la cantidad de datos disponibles crece exponencialmente.

Worldwide Information Company pronostica que para 2025 la esfera de datos international será 163 zettabytesfrente a los 16,1 zettabytes de 2016, y que la persona conectada promedio interactuará con los dispositivos conectados casi 4800 veces al día.

Con esa cantidad de datos generados y recopilados, la privacidad de los datos es cada vez más importante. El Día de la Privacidad de Datos, que fue instituido por el Consejo de Europa en 2007 como Día de la Protección de Datosel 28 de enero de cada año, es un día tan bueno como cualquier otro para contemplar lo que esto significa.

El valor de los datos

Los datos generalmente se recopilan de una de estas tres maneras:

  • Observaciones—Científicos, analistas e incluso especialistas en advertising observan el comportamiento de los clientes y lo registran.
  • inferencias—Los datos se pueden inferir en función del historial de búsqueda, las compras o la actividad en las redes sociales de un usuario.
  • voluntario—Las personas proporcionan datos a las organizaciones a través de encuestas y formularios.

Una vez que se han recopilado los datos, se pueden utilizar para resolver problemas y responder preguntas. La ciencia de datos se basa en datos que se relacionan con el problema que está tratando de resolver o la pregunta que está tratando de responder, por lo que la información de identificación private (PII) no es necesaria en muchos casos. Lo importante es que los datos sean representativos del problema que está resolviendo. Es imperativo que un científico de datos pueda reconocer cuándo excluir datos, por ejemplo, para evitar errores o sesgos en entornos de inteligencia synthetic y aprendizaje automático.

Por qué la privacidad de datos es tan importante

Los datos normalmente se almacenan en servidores locales o en la nube. Es responsabilidad ética y authorized de una empresa cuidar el aspecto de la privacidad. Muchas veces esa responsabilidad recaerá en el ámbito del ingeniero de datos o de los administradores de la base de datos.

Anonimizar los datos eliminando o cifrando los identificadores directos de las personas, como el nombre completo, la dirección, el correo electrónico, el número de identificación private, la descripción física o la información biométrica de una persona (la PII) y evitando la capacidad de volver a identificarlos, es una forma de garantizar que los datos privacidad.

McKinsey argumenta que la regulación efectiva de la anonimización de datos es en realidad una oportunidadal reducir los riesgos para las personas y las organizaciones, al tiempo que hace que los datos estén más disponibles para el análisis.

Las leyes de protección de datos varían de país a país, pero existen prácticas comunes como: Tener una estrategia de prevención de pérdida de datos y descubrimiento de datos; copias de seguridad frecuentes; protecciones integradas como replicación, cortafuegos, encriptación, autorización y autenticación; y estrategias de borrado y recuperación.

Podría decirse que el Reglamento Basic de Protección de Datos (RGPD) de la Unión Europea tiene el alcance más amplio. La Carta de los Derechos Fundamentales de la UE estipula que los ciudadanos de la UE tienen derecho a la protección de sus datos personales, y en virtud del RGPD Se emitieron 1.031 multas en el año hasta marzo de 2022, por un whole de 1.581 millones de euros.

Cabe señalar que estas multas no se impusieron a los ciberdelincuentes, sino a corporaciones conocidas por incumplimientos de las normas, como base authorized insuficiente para el procesamiento de datos; incumplimiento de los principios generales de procesamiento de datos; y medidas técnicas y organizativas insuficientes para garantizar la seguridad de la información.

Como individuo en línea, ¿qué puede hacer?

Hay muchas cosas que puede hacer para proteger sus datos. Las cosas más básicas son:

  • Utilice contraseñas seguras, de al menos 11 caracteres con una combinación de letras mayúsculas y minúsculas, símbolos y números; un ciberdelincuente tardaría al menos 400 años en descifrar su contraseña que cumpliera con estas condiciones. Las contraseñas más largas lo hacen aún más difícil.
  • Haz una copia de seguridad de tus datos
  • No abras correos electrónicos sospechosos
  • Nunca proporcione datos personales como un número de identificación del gobierno por teléfono

Josh McCloud, responsable nacional de ciberseguridad de Cisco en Singapur, tiene una gran consejos de ciberseguridad en línea. O puede explorar el tema con mayor profundidad inscribiéndose en el curso gratuito de Cisco Networking Academy. Introducción a la Ciberseguridad curso, diseñado para hacer que la conciencia de seguridad cibernética esté disponible para todos.

Si, como yo, siente curiosidad por el mundo que lo rodea y tiene interés en la resolución de problemas, todos los datos que se recopilan representan una enorme oportunidad para mejorar las comunidades y organizaciones en todos los rincones del mundo.

¿Qué tiene de bueno la ciencia de datos?

Una silueta de una mujer con un gráfico superpuesto técnico azul brillanteIntroducción a la ciencia de datos es un curso básico de Cisco Networking Academy que un equipo de científicos del aprendizaje y yo mismo desarrollamos para permitir que cualquier persona se familiarice con el campo de la ciencia de datos. Puede aprender sobre ciencia de datos a un alto nivel y de una manera intuitiva e interactiva de forma gratuita en nuestra plataforma de aprendizaje Expertise for All ‘mobile-first’.

La ciencia de datos afecta nuestras vidas de muchas maneras:

  • En la industria del entretenimiento, la ciencia de datos es responsable de los algoritmos de clasificación que ayudan a los espectadores a encontrar los movies que les gustan. Según su perfil, incluidos los movies que han visto y lo que han visto otros clientes con gustos similares, los algoritmos ofrecen recomendaciones.
  • La aplicación de acondicionamiento físico en su teléfono inteligente, o rastreador de acondicionamiento físico, recopila datos que se introducen en una aplicación que puede brindarle información valiosa sobre la salud. Para calcular cuántos pasos das durante un día o la distancia que recorres, estas apps deben construir un modelo de tus movimientos para identificar en qué consiste dar un paso y la distancia que recorres con cada uno. Algunos rastreadores de actividad física incluso utilizan software program de inteligencia synthetic (IA) de autoaprendizaje que puede reconocer y adaptarse a una amplia variedad de movimientos y puede aprender nuevas actividades de acondicionamiento físico que se basan en patrones cíclicos repetitivos.
  • En la agricultura, los agricultores usan teléfonos celulares para proporcionar a los investigadores imágenes de enfermedades de las plantas. Estas imágenes se utilizan en sistemas de reconocimiento de imágenes para diagnosticar las enfermedades y, combinadas con la regresión de datos ambientales, se utilizan algoritmos para predecir futuros brotes.
  • Y en medicina, los investigadores han desarrollado un modelo de aprendizaje automático que utiliza la probabilidad para clasificar el cáncer de mama mediante el examen de imágenes de histopatología médica. Este enfoque puede eventualmente ser capaz de detectar subtipos de cáncer y clasificar tejido benigno y maligno.

La ciencia de datos es una herramienta poderosa para el bien, y estos son solo algunos ejemplos de su aplicación. En la superficie, el costo de la privacidad de los datos puede parecer un impedimento para los posibles avances que puede traer la ciencia de datos. Sin embargo, la privacidad de datos otorga a los científicos de datos una licencia social para usar esa herramienta de manera responsable. Todo el mundo gana.

Cuota:

Related Articles

Registros escolares y derechos de los estudiantes

Los estudiantes de las escuelas públicas no pierden sus derechos...

Comments

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Same Category

spot_img

Stay in touch!

Follow our Instagram