Google for Developers: febrero 2018

12 prácticas recomendadas para la administración de cuentas de usuario, autorizaciones y contraseñas

martes, 27 de febrero de 2018

Por Ian Maddox, arquitecto de GCP SolutionsGoogle Cloud PlatformGoogle Kubernetes EngineApigeeFirebase 1. Guarda las contraseñas;aplicar salintentar revertir tu algoritmo de hashing 2. Si es posible, permite el uso de proveedores de identidad externosFirebase Authestudios de casos 3. Separa el concepto de identidad del usuario y cuenta del usuario 4. Permite la vinculación de varias identidades con una sola cuenta de usuario nombre de usuario y contraseñaGoogle Sign-Invincular varias identidades 5. No bloquees contraseñas extensas o complejascomplejidad y seguridad de las contraseñasBase64KlingonEmoji 6. No impongas reglas disparatadas para los nombres de usuario 7. Permite que los usuarios cambien su nombre de usuario muy buenas razones
8. Permite que tus usuarios borren sus cuentas se te exija, por medios legales, acceder 9. Toma una decisión consciente con respecto a la duración de las sesiones duración de las sesionesgarantizar que los usuarios sean quienes dicen seraumentar aún más su seguridadumbrales 10. Usa verificación en dos pasos verificación en dos pasosNIST ha dejado de usar 11. Haz que no se distingan mayúsculas y minúsculas para los ID de usuario 12. Crea un sistema de autenticación seguro restablecimiento de contraseña
Consultas adicionales

En NIST 800-063B se abarcan la administración de la autenticación y el ciclo de vida.

OWASP actualiza continuamente su Hoja de referencia de almacenamiento de contraseñas.

OWASP proporciona información aún más detallada en la Hoja de referencia de autenticación.

En el sitio de Firebase Authentication de Google se ofrece una amplia biblioteca de guías, material de referencia y ejemplos de código.

Mejoramiento de los modelos integrales para el reconocimiento de voz

viernes, 23 de febrero de 2018

Publicado por Tara N. Sainath, científica investigadora, equipo de voz, y Yonghui Wu, ingeniero de software, equipo de ideas de Google Los sistemas de reconocimiento de voz automáticos (ASR) tradicionales, que se usan para diferentes aplicaciones de búsqueda por voz en Google, constan de un modelo acústico (AM), un modelo de pronunciación (PM) y un modelo de idioma (LM), que se preparan individualmente y, por lo general, se diseñan manualmente, en diferentes conjuntos de datos [1]. Los AM toman funciones acústicas y predicen un conjunto de unidades de subpalabras; normalmente, fonemas dependientes e independientes del contexto. Luego, un léxico diseñado manualmente (el PM) asigna una secuencia de fonemas, producida por el modelo acústico, a palabras. Por último, el LM asigna probabilidades a secuencias de palabras. La preparación de componentes independientes crea otras complejidades y no es óptimo cuando se compara con la preparación de todos los componentes de forma conjunta. Durante los últimos años, se ha vuelto cada vez más popular el desarrollo de sistemas integrales, cuyo propósito es aprender esos componentes independientes de forma conjunta como un solo sistema. Si bien esos modelos integrales han mostrado resultados prometedores en la literatura [2, 3], aún no está claro si esos enfoques pueden mejorar en los sistemas convencionales de vanguardia actuales.
Hoy compartimos con entusiasmo “Reconocimiento de voz innovador con modelos secuenciales [4]”, que describe un nuevo modelo integral que supera el rendimiento de un sistema de producción convencional [1]. Mostramos que nuestro sistema integral alcanza un índice de error de palabras (WER) del 5,6%, que corresponde a una mejora relativa del 16% en comparación con un sistema convencional sólido, que alcanza un WER del 6,7%. Además, el modelo integral usado para generar la hipótesis de palabras inicial, antes de realizar una nueva puntuación de cualquier hipótesis, es 18 veces más pequeño que el modelo convencional, ya que no contiene LM ni PM independientes.
Nuestro sistema se basa en la arquitectura integral escuchar-asistir-deletrear (LAS), que se presentó por primera vez en [2]. La arquitectura LAS consta de 3 componentes. El componente codificador de escucha, similar a un AM estándar, toma una representación de frecuencia de tiempo de la señal de voz de entrada, x, y usa un conjunto de capas de red neurales para asignar los datos de entrada a una representación de función de nivel superior, h^enc. Los datos de salida del codificador se pasan a un mecanismo de atención, que usa h^enc para determinar una alineación entre las funciones de entrada x y las unidades de subpalabra previstas {y_n, … y₀}, donde cada subpalabra generalmente es un grafema o una parte de una palabra. Por último, el resultado del módulo de atención se pasa al deletreador (es decir, el decodificador), similar a un LM, que produce una distribución de probabilidad entre un conjunto de palabras supuestas.

Componentes del modelo integral LAS.

Todos los componentes del modelo LAS se preparan de forma conjunta como una sola red neural integral, no como módulos independientes propios de los sistemas convencionales, lo cual hace mucho más simple el proceso. Además, debido a que el modelo LAS es completamente neural, no se requieren componentes externos diseñados manualmente, como transductores de estado limitados, un léxico o módulos de normalización de texto. Por último, a diferencia de lo que sucede con los modelos convencionales, para la preparación de modelos integrales no se necesitan arranques desde árboles de decisión ni alineaciones de tiempo generadas por un sistema independiente; esta se puede lograr a partir de pares de transcripciones de texto y de la acústica correspondiente.
En [4], presentamos diferentes mejoras estructurales nuevas, que incluyen la optimización de los vectores de atención que se pasan al decodificador y la preparación con unidades de subpalabras más extensas (es decir, partes de palabras). A su vez, también presentamos varias mejoras de optimización para la preparación, entre las que se incluyen el uso de preparación con un índice de error de palabras mínimo [5]. Estas mejoras estructurales y de optimización son las que permiten alcanzar la mejora relativa del 16% en comparación con el modelo convencional.
Otro campo de aplicación potencial que genera entusiasmo para esta investigación es el de los sistemas multidialecto y multilingüe, en el cual la facilidad de optimización de una red neural individual hace que el modelo sea muy atractivo. Aquí, los datos para todos los dialectos e idiomas se pueden combinar para preparar una red sin la necesidad de un AM, PM y LM independientes para cada dialecto o idioma. Estos modelos funcionan bien en 7 dialectos del inglés [6] y 9 idiomas de la India [7], y su rendimiento supera al de un modelo preparado de forma independiente para cada idioma o dialecto por separado.
Si bien estamos entusiasmados con los resultados, nuestro trabajo no ha terminado. Actualmente, estos modelos no pueden procesar voz en tiempo real [8, 9 y 10], que es un requisito importante para las aplicaciones sensibles a la latencia, como la búsqueda por voz. Además, la comparación de estos modelos con la producción aún es negativa cuando se evalúan en los datos de producción en tiempo real. Además, nuestro modelo integral incorpora 22 millones de enunciados en pares de audio-texto en comparación con un sistema convencional, que generalmente se prepara con elementos mucho más extensos. A esto se suma que nuestro modelo propuesto no puede aprender a deletrear de forma correcta palabras de uso poco frecuente, como nombres propios, algo que generalmente se logra con un PM diseñado manualmente. Nuestros esfuerzos continuos se centran en la manera de abordar esos desafíos. Agradecimientos Este trabajo se realizó en un gran esfuerzo colaborativo entre los equipos de ideas y voz de Google. Entre los colaboradores se incluyen Tara Sainath, Rohit Prabhavalkar, Bo Li, Kanishka Rao, Shankar Kumar, Shubham Toshniwal, Michiel Bacchiani y Johan Schalkwyk, del equipo de voz, y Yonghui Wu, Patrick Nguyen, Zhifeng Chen, Chung-cheng Chiu, Anjuli Kannan, Ron Weiss, Navdeep Jaitly, William Chan, Yu Zhang y Jan Chorowski, del equipo de ideas de Google. El trabajo se describe de forma más detallada en los documentos [4-12].ReferenciasLower Frame Rate Neural Network Acoustic ModelsListen, attend and spellA Comparison of Sequence-to-sequence Models for Speech RecognitionState-of-the-art Speech Recognition With Sequence-to-Sequence ModelsMinimum Word Error Rate Training for Attention-based Sequence-to-Sequence ModelsMulti-Dialect Speech Recognition With a Single Sequence-to-Sequence ModelEnd-to-End Multilingual Speech Recognition using Encoder-Decoder ModelsImproving the Performance of Online Neural Transducer ModelsMonotonic Chunkwise AttentionLearning Hard Alignments with Variational InferenceNo Need for a Lexicon? Evaluating the Value of the Pronunciation Lexica in End-to-End ModelsAn Analysis of Incorporating an External Language Model into a Sequence-to-Sequence Model

Usa Forseti para asegurarte de que tus clústeres de Google Kubernetes Engine se actualicen para “Meltdown” y “Spectre”

miércoles, 21 de febrero de 2018

Por Andrew Hoying, experto en Seguridad de Google Cloud.

El mes pasado, Project Zero divulgó detalles sobre las vulnerabilidades de CPU que se han denominado “Meltdown” y “Spectre”, y te informamos que Google Cloud se actualizó para brindar protección contra todas las vulnerabilidades conocidas.
Los clientes que poseen equipos virtuales (VM) en los servicios de Google Cloud deben continuar siguiendo las prácticas recomendadas de seguridad y aplicar periódicamente todas las actualizaciones de seguridad, tal como lo harían con cualquier otra vulnerabilidad del sistema operativo. Proporcionamos una lista completa de medidas recomendadas para que los clientes de GCP puedan protegerse contra estas vulnerabilidades.
Una medida recomendada es actualizar todos los clústeres de Google Kubernetes Engine para garantizar que se revise por completo la imagen del VM subyacente. Puedes hacerlo automáticamente habilitando la actualización automática en tus grupos de nodos de Kubernetes. ¿Quieres asegurarte de que todos tus clústeres tengan una versión revisada que contemple estas vulnerabilidades de CPU? El equipo de seguridad de Google Cloud desarrolló un escáner que puede resultar útil.
Este se encuentra en Forseti Security, un conjunto de herramientas de código abierto para GCP que te permite identificar rápidamente clústeres de Kubernetes Engine aún no revisados.
Si ya instalaste Forseti, debes actualizarlo a la versión 1.1.10 y habilitar el escáner. Si aún no lo has hecho, instala Forseti Security en un nuevo proyecto de tu organización en GCP. El escáner comprobará, una vez por hora, la versión de los grupos de nodos de todos los clústeres de Kubernetes Engine que se ejecuten en todos tus proyectos de GCP. Forseti registra las infracciones que detecta en su tabla de infracciones y, opcionalmente, envía un correo electrónico a tus administradores de GCP para ayudarte a identificar cualquier exposición persistente a Meltdown.

El conjunto de herramientas Forseti se puede usar de muchas formas diferentes para ayudarte a preservar la seguridad. Para obtener más información sobre la comunidad Forseti, lee esta entrada del blog. Si tienes preguntas sobre esta herramienta, envía un mensaje a discuss@forsetisecurity.org.

12 prácticas recomendadas para la administración de cuentas de usuario, autorizaciones y contraseñas

Mejoramiento de los modelos integrales para el reconocimiento de voz

Usa Forseti para asegurarte de que tus clústeres de Google Kubernetes Engine se actualicen para “Meltdown” y “Spectre”

Labels

Archive

Feed