DataRobot, la empresa Data Science con sede en Boston, permite a los analistas de negocios construir análisis predictivos sin conocimiento de Machine Learning o programación. Utiliza ML automatizado para construir e implementar modelos predictivos precisos en un corto espacio de tiempo.

DataRobot fue fundado en 2012 en Boston por Jeremy Achin y Tom de Godoy. Ambos cuentan con una amplia experiencia en el manejo de la ciencia de los datos y los modelos ML. En la ronda de financiación más reciente, ha recaudado $ 54 millones en la Serie C por parte de New Enterprise Associates (NEA). La compañía ha recaudado hasta ahora una suma de $ 111.4 millones de Accomplice, NEA, IA Ventures e Intel, entre otros inversores.

La plataforma DataRobot ha evolucionado durante los últimos años

AutoML está revolucionando los datos y los dominios de inteligencia artificial llevando el poder del análisis predictivo a las empresas. Un analista que esté familiarizado con las principales herramientas de inteligencia empresarial puede aprovechar las plataformas AutoML para construir e implementar modelos de Aprendizaje automático altamente sofisticados. Los científicos de datos experimentados pueden ir a múltiples niveles más profundo que un analista de negocios para personalizar y optimizar los modelos.

La plataforma DataRobot ha evolucionado durante los últimos años para aprovechar las innovaciones en la nube pública. Las empresas pueden elegir ejecutar el software en la nube pública o en el centro de datos local.

La versión alojada llamada DataRobot Cloud Platform actualmente se ejecuta en AWS. En AWS re: Invent el año pasado, la compañía alcanzó el estado de Competencia ML de Amazon Web Services (AWS). DataRobot afirma que los clientes han construido más de 500,000,000 de modelos en DataRobot Cloud en AWS.

DataRobot ofrece un estilo de asistente de experiencia de usuario para generar modelos de Machine Learning.

En solo seis pasos, las empresas pueden implementar un servicio de análisis predictivo en tiempo real respaldado por un modelo preciso de Machine Learning.

Los analistas de negocios y los científicos de datos pueden llevar a cabo actividades exploratorias de datos

Todo comienza subiendo el conjunto de datos a la plataforma DataRobot, que acepta la entrada de un archivo, una URL remota, una fuente de datos JDBC o HDFS.

Una vez que se han ingerido los datos, la plataforma infiere el esquema sugiriendo tipos de datos apropiados para cada característica. Los analistas de negocios y los científicos de datos pueden llevar a cabo actividades exploratorias de datos necesarias en el conjunto de datos ingerido. Finalmente, deben seleccionar la etiqueta objetivo que predecirá el modelo.

Durante el tercer paso, todo lo que el usuario tiene que hacer es hacer clic en el botón de inicio para iniciar el proceso de modelado. Esto es cuando DataRobot crea una larga cola de algoritmos y los entrena con el conjunto de datos cargado. Dependiendo del tamaño del conjunto de datos y la cantidad de algoritmos, la tarea puede tardar de unos minutos a varias horas.

Finalmente, los resultados del proceso de modelado se muestran en la tabla de clasificación del modelo, con los mejores modelos (basados ​​en la métrica de rendimiento elegida) en la parte superior de la lista.Los usuarios pueden explorar cada modelo para comprender la metodología y los parámetros utilizados en el proceso de capacitación. Pueden probar cada modelo con un conjunto de datos de prueba para medir la precisión.

Una vez que se ha elegido un modelo de la tabla de líderes, se implementa como una API. El punto final está listo para tratar con los datos de producción. Cualquier desarrollador con la clave API puede invocar esto como cualquier otro servicio RESTful.

La belleza de DataRobot reside en su extensibilidad.

Dependiendo del nivel de comodidad y la función del trabajo, los usuarios pueden ir a la profundidad de la plataforma para tomar el control del flujo de trabajo. Si bien los analistas de negocios pueden usarlo como un asistente, los científicos expertos en datos pueden ajustar muchos parámetros para obtener modelos precisos.

DataRobot lidió elegantemente con problemas de negocios como previsión de ventas, análisis de abandono de clientes, detección de anomalías y modelado de series de tiempo. Existen algunas limitaciones a la plataforma que pueden abordarse en las versiones futuras.

Una de las limitaciones es que no puede tratar con imágenes y datos no estructurados. No pude entrenar una red neuronal convolucional (CNN) para clasificar imágenes y objetos.

La colección de modelos incluye algoritmos de aprendizaje profundo, pero no pueden usarse para CNN en este momento.

Los clientes con la opción premium habilitada pueden exportar un modelo completamente entrenado como un archivo JAR Java autónomo para alojarlo fuera de la plataforma DataRobot. Esta característica es importante en escenarios donde los modelos ML se ejecutan en modo fuera de línea.

Es una de las plataformas únicas de AutoML que se puede ejecutar en la nube pública

Con AutoML convirtiéndose en la clave para democratizar la inteligencia artificial, cada proveedor de plataforma se está subiendo al carro. Google está listo para lanzar sus API de AutoML, y Microsoft ya se ha lanzado con sus servicios cognitivos personalizados.

DataRobot es una de las plataformas únicas de AutoML que se puede ejecutar en la nube pública y en los centros de datos locales. La aguda escasez de científicos de datos combinada con la evolución de las regulaciones de privacidad hace que DataRobot sea muy atractivo para las empresas. El futuro de la IA está en AutoML. Como uno de los primeros en moverse en este espacio, DataRobot tiene el potencial de convertirse en una plataforma líder de AutoML.

¡No te pierdas nuestra pagina de Facebook!!