h2oai / h2o-3

Jun 10, 2021
admin

H2O es una plataforma en memoria para el aprendizaje automático distribuido y escalable. H2O utiliza interfaces familiares como R, Python, Scala, Java, JSON y el cuaderno/interfaz web Flow, y trabaja sin problemas con tecnologías de big data como Hadoop y Spark. H2O proporciona implementaciones de muchos algoritmos populares, como los modelos lineales generalizados (GLM), las máquinas de refuerzo de gradiente (incluyendo XGBoost), los bosques aleatorios, las redes neuronales profundas, los conjuntos apilados, Naive Bayes, los modelos aditivos generalizados (GAM), los riesgos proporcionales de Cox, K-Means, PCA, Word2Vec, así como un algoritmo de aprendizaje automático completo (H2O AutoML).

H2O es extensible para que los desarrolladores puedan añadir transformaciones de datos y algoritmos personalizados de su elección y acceder a ellos a través de todos esos clientes. Los modelos de H2O pueden ser descargados y cargados en la memoria de H2O para su calificación, o exportados en formato POJO o MOJO para una calificación extemadamente rápida en producción. Puede encontrar más información en la Guía del usuario de H2O.

H2O-3 (este repositorio) es la tercera encarnación de H2O, y el sucesor de H2O-2.

Tabla de contenidos

  • Descarga de H2O-3
  • Recursos de código abierto
    • Seguimiento de temas y solicitudes de características
    • Lista de recursos de H2O
  • Utilización de artefactos de código de H2O-3 (bibliotecas)
  • Construcción de H2O-3
  • Lanzando H2O después de construir
  • Construyendo H2O en Hadoop
  • Sparkling Water
  • Documentación
  • Citando H2O
  • Mapa de ruta
  • Comunidad / Asesores / Inversores

1. Descargar H2O-3

Aunque la mayor parte de este README está escrito para los desarrolladores que hacen sus propias construcciones, la mayoría de los usuarios de H2O simplemente descargan y utilizan una versión preconstruida. Si usted es un usuario de Python o R, la forma más fácil de instalar H2O es a través de PyPI o Anaconda (para Python) o CRAN (para R):

Python

pip install h2o

R

install.packages("h2o")

Más información sobre la descarga & la instalación de H2O está disponible en la Guía del usuario de H2O.

2. Recursos de código abierto

La mayoría de la gente interactúa con tres o cuatro recursos principales de código abierto: GitHub (que ya has encontrado), JIRA (para informes de errores y seguimiento de problemas), Stack Overflow para preguntas específicas de código/software de H2O, y h2ostream (un grupo de Google / foro de discusión por correo electrónico) para preguntas no adecuadas para Stack Overflow. También hay un grupo de chat Gitter H2O desarrollador, sin embargo, para fines de archivo & para maximizar la accesibilidad, preferimos que H2O estándar Q&A se llevó a cabo en Stack Overflow.

2.1 Seguimiento de problemas y solicitudes de características

(Nota: Sólo hay un sistema de seguimiento de problemas para el proyecto. Las incidencias de GitHub no están habilitadas; debes usar JIRA.)

Puedes navegar y crear nuevas incidencias en nuestro JIRA de código abierto: http://jira.h2o.ai

  • Puedes navegar y buscar incidencias sin iniciar sesión en JIRA:
    1. Haga clic en el menú Issues
    2. Haga clic en Search for issues
  • Para crear una incidencia (ya sea un error o una solicitud de función), cree primero una cuenta:
    1. Haga clic en el botón Log In en la parte superior derecha de la pantalla
    2. Haga clic en Create an acccount cerca de la parte inferior del cuadro de inicio de sesión
    3. Una vez que haya creado una cuenta y haya iniciado sesión, utilice el botón Create en el menú para crear una cuestión
    4. Cree cuestiones H2O-3 en el proyecto PUBDEV. (Nota: las preguntas sobre Sparkling Water deben archivarse en el proyecto SW.)
  • También puede votar por las solicitudes de características y/o otros problemas. Las votaciones pueden ayudar a H2O a priorizar las características que se incluyen en cada versión.
    1. Vaya a la página JIRA de H2O.
    2. Haga clic en Log In para iniciar sesión o crear una cuenta si aún no tiene una.
    3. Busque la característica que desea priorizar, o cree una nueva característica.
    4. Haga clic en el enlace Vote for this issue. Esto se encuentra en el lado derecho de la cuestión en la sección de la gente.

2.2 Lista de recursos de H2O

3. Uso de artefactos de H2O-3

Cada construcción nocturna publica artefactos de R, Python, Java y Scala en un repositorio específico de la construcción. En particular, puedes encontrar los artefactos de Java en el directorio maven/repo.

Aquí hay un fragmento de ejemplo de un archivo de construcción de gradle usando h2o-3 como dependencia. Reemplace x, y, z, y nnnn con números válidos.

Refiérase a la última página de construcción nocturna de H2O-3 bleeding edge para obtener información sobre la instalación de artefactos de construcción nocturna.

Refiérase al repositorio GitHub de h2o-droplets para obtener un ejemplo de trabajo de cómo usar artefactos Java con gradle.

Nota: Los artefactos estables de H2O-3 se publican periódicamente en Maven Central (haz clic aquí para buscar) pero pueden ir sustancialmente por detrás de las construcciones nocturnas de H2O-3 Bleeding Edge.

4. Construir H2O-3

Comenzar con el desarrollo de H2O requiere JDK 1.7, Node.js, Gradle, Python y R. Usamos la envoltura de Gradle (llamada gradlew) para asegurar que las versiones locales actualizadas de Gradle y otras dependencias están instaladas en tu directorio de desarrollo.

4.1. Construir H2O-3 Antes de construir

La construcción de h2o requiere un entorno de R correctamente configurado con los paquetes necesarios y un entorno de Python con los siguientes paquetes:

gripcoloramafuturetabulaterequestswheel

Para instalar estos paquetes puedes utilizar pip o conda.Si tienes problemas para instalar estos paquetes en Windows, sigue la sección Configuración en Windows de esta guía.

(Nota: Se recomienda utilizar algún entorno virtual como VirtualEnv, para instalar todos los paquetes. )

4.2. Construir desde la línea de comandos (Inicio rápido)

Para construir H2O desde el repositorio, realice los siguientes pasos.

Receta 1: Clonar fresh, construir, omitir las pruebas y ejecutar H2O

Receta 2: Clonar fresh, construir y ejecutar las pruebas (requiere una instalación en funcionamiento de R)

git clone https://github.com/h2oai/h2o-3.gitcd h2o-3./gradlew syncSmalldata./gradlew syncRPackages./gradlew build

Notas:

  • La ejecución de las pruebas inicia cinco JVMs de prueba que forman un cluster de H2O y requiere al menos 8GB de RAM (preferiblemente 16GB de RAM).
  • La ejecución de ./gradlew syncRPackages es compatible con Windows, OS X y Linux, y se recomienda encarecidamente pero no es obligatorio. ./gradlew syncRPackages asegura un entorno completo y consistente con versiones pre-aprobadas de los paquetes requeridos para las pruebas y construcciones. Los paquetes se pueden instalar manualmente, pero recomendamos establecer una variable ENV y utilizar ./gradlew syncRPackages. Para establecer la variable ENV, utilice el siguiente formato (donde `${WORKSPACE} puede ser cualquier ruta):
mkdir -p ${WORKSPACE}/Rlibraryexport R_LIBS_USER=${WORKSPACE}/Rlibrary

Receta 3: Extraer, limpiar, construir y ejecutar pruebas

git pull./gradlew syncSmalldata./gradlew syncRPackages./gradlew clean./gradlew build

Notas

  • Recomendamos utilizar ./gradlew clean después de cada git pull.

  • Salta las pruebas añadiendo -x test al final de la línea de comandos de gradle build. Las pruebas normalmente se ejecutan durante 7-10 minutos en un portátil Macbook Pro con 4 CPUs (8 hyperthreads) y 16 GB de RAM.

  • Sincronizar smalldata no es necesario después de cada pull, pero si las pruebas fallan debido a la falta de archivos de datos, entonces intente ./gradlew syncSmalldata como el primer paso de solución de problemas. Sincronizar smalldata descarga los archivos de datos de AWS S3 al directorio smalldata en su espacio de trabajo. La sincronización es incremental. No compruebe estos archivos. El directorio smalldata está en .gitignore. Si no ejecuta ninguna prueba, no necesita el directorio smalldata.

  • La ejecución de ./gradlew syncRPackages es compatible con Windows, OS X y Linux, y se recomienda encarecidamente pero no es obligatoria. ./gradlew syncRPackages asegura un entorno completo y consistente con versiones pre-aprobadas de los paquetes necesarios para las pruebas y las construcciones. Los paquetes pueden instalarse manualmente, pero recomendamos establecer una variable ENV y utilizar ./gradlew syncRPackages. Para establecer la variable ENV, utilice el siguiente formato (donde ${WORKSPACE} puede ser cualquier ruta):

    mkdir -p ${WORKSPACE}/Rlibraryexport R_LIBS_USER=${WORKSPACE}/Rlibrary

Receta 4: Sólo construir los docs

./gradlew clean && ./gradlew build -x test && (export DO_FAST=1; ./gradlew dist)open target/docs-website/h2o-docs/index.html

4.3. Configuración en Windows

Paso 1: Descargue e instale WinPython.

Desde la línea de comandos, valide que python está utilizando el paquete recién instalado mediante which python (o sudo which python). Actualice la variable de entorno con la ruta de WinPython.

Paso 2: Instale los paquetes de Python necesarios:
pip install grip 'colorama>=0.3.8' future tabulate wheel
Paso 3: Instale JDK

Instale Java 1.7 y añada el directorio apropiado C:\Program Files\Java\jdk1.7.0_65\bin con java.exe a PATH en las variables de entorno. Para asegurarse de que el símbolo del sistema está detectando la versión correcta de Java, ejecute:

javac -version

La variable CLASSPATH también debe establecerse en la subcarpeta lib del JDK:

CLASSPATH=/<path>/<to>/<jdk>/lib
Paso 4. Instale Node.js

Instale Node.js y añada el directorio instalado C:\Program Files\nodejs, que debe incluir node.exe y npm.cmd al PATH si no está ya preinstalado.

Paso 5. Instala R, los paquetes necesarios y Rtools:

Instala R y añade el directorio bin a tu PATH si no está ya incluido.

Instale los siguientes paquetes de R:

  • RCurl
  • jsonlite
  • statmod
  • devtools
  • roxygen2
  • testthat

Para instalar estos paquetes desde una sesión de R:

Tenga en cuenta que libcurl es necesario para la instalación del paquete RCurl R.

Note que estos paquetes no cubren la ejecución de pruebas, son sólo para la construcción de H2O.

Por último, instale Rtools, que es una colección de herramientas de línea de comandos para facilitar el desarrollo de R en Windows.

NOTA: Durante la instalación de Rtools, no instale Cygwin.dll.

Paso 6. Instalar Cygwin

NOTA: Durante la instalación de Cygwin, deseleccionar los paquetes de Python para evitar un conflicto con el paquete de Python.org.

Paso 6b. Valide Cygwin

Si Cygwin ya está instalado, elimine los paquetes de Python o asegúrese de que Native Python está antes que Cygwin en la variable PATH.

Paso 7. Actualizar o validar la variable PATH de Windows para incluir R, Java JDK, Cygwin.
Paso 8. Clonar Git h2o-3

Si aún no tienes un cliente Git, instala uno. El que viene por defecto se puede encontrar aquí http://git-scm.com/downloads. Asegúrese de que el soporte del símbolo del sistema está activado antes de la instalación.

Descargue y actualice los códigos fuente de h2o-3:

git clone https://github.com/h2oai/h2o-3
Paso 9. Ejecutar el gradle build de nivel superior:

cd h2o-3./gradlew.bat build

Si encuentra errores ejecute de nuevo con --stacktrace para más instrucciones sobre las dependencias que faltan.

4.4. Configuración en OS X

Si no tienes Homebrew, te recomendamos que lo instales. Hace que la gestión de paquetes para OS X sea fácil.

Paso 1. Instalar JDK

Instalar Java 1.7. Para asegurarse de que el símbolo del sistema detecta la versión correcta de Java, ejecute:

javac -version
Paso 2. Instala Node.js:

Usando Homebrew:

brew install node

De lo contrario, instala desde el sitio web de NodeJS.

Paso 3. Instala R y los paquetes necesarios:

Instala R y añade el directorio bin a tu PATH si no está ya incluido.

Instale los siguientes paquetes de R:

  • RCurl
  • jsonlite
  • statmod
  • devtools
  • roxygen2
  • testthat

Para instalar estos paquetes desde una sesión de R:

Tenga en cuenta que libcurl es necesario para la instalación del paquete RCurl R.

Nótese que estos paquetes no cubren la ejecución de pruebas, son sólo para construir H2O.

Paso 4. Instalar python y los paquetes necesarios:

Instalar python:

brew install python

Instalar el gestor de paquetes pip:

sudo easy_install pip

A continuación, instalar los paquetes necesarios:

sudo pip install wheel requests 'colorama>=0.3.8' future tabulate 
Paso 5. Git Clone h2o-3

OS X debería tener ya instalado Git. Para descargar y actualizar los códigos fuente de h2o-3:

git clone https://github.com/h2oai/h2o-3
Paso 6. Ejecutar el gradle build de nivel superior:
cd h2o-3./gradlew build

Nota: en una máquina normal puede tardar mucho tiempo (alrededor de una hora) en ejecutar todas las pruebas.

Si encuentras errores ejecuta de nuevo con --stacktrace para obtener más instrucciones sobre las dependencias que faltan.

4.5. Configuración en Ubuntu 14.04

Paso 1. Instalar Node.js
curl -sL https://deb.nodesource.com/setup_0.12 | sudo bash -sudo apt-get install -y nodejs
Paso 2. Instalar JDK:

Instalar Java 8. Las instrucciones de instalación se pueden encontrar aquí Instalación del JDK. Para asegurarse de que el símbolo del sistema detecta la versión correcta de Java, ejecute:

javac -version
Paso 3. Instalar R y los paquetes necesarios:

Las instrucciones de instalación se pueden encontrar aquí Instalación de R. Haga clic en «Descargar R para Linux». Haga clic en «ubuntu». Siga las instrucciones dadas.

Para instalar los paquetes necesarios, siga las mismas instrucciones que para OS X arriba.

Nota: Si el proceso falla al instalar RStudio Server en Linux, ejecute uno de los siguientes:

sudo apt-get install libcurl4-openssl-dev

o

sudo apt-get install libcurl4-gnutls-dev

Paso 4. Git Clone h2o-3

Si aún no tienes un cliente Git:

sudo apt-get install git

Descarga y actualiza los códigos fuente de h2o-3:

git clone https://github.com/h2oai/h2o-3
Paso 5. Ejecuta la compilación gradle de nivel superior:
cd h2o-3./gradlew build

Si encuentras errores, ejecuta de nuevo usando --stacktrace para obtener más instrucciones sobre las dependencias que faltan.

Asegúrate de que no estás ejecutando como root, ya que bower rechazará dicha ejecución.

4.6. Configuración en Ubuntu 13.10

Paso 1. Instalar Node.js
curl -sL https://deb.nodesource.com/setup_10.x | sudo bash -sudo apt-get install -y nodejs
Pasos 2-4. Siga los pasos 2-4 para Ubuntu 14.04 (superior)

4.7. Configuración en CentOS 7

5. Lanzamiento de H2O después de la construcción

Para iniciar el clúster H2O localmente, ejecute lo siguiente en la línea de comandos:

java -jar build/h2o.jar

Una lista de opciones disponibles de JVM de inicio y H2O (por ejemplo, -Xmx, -nthreads, -ip), está disponible en la Guía del usuario de H2O.

6. Construcción de H2O en Hadoop

Los archivos zip de H2O-on-Hadoop preconstruidos están disponibles en la página de descargas. Cada versión de distribución de Hadoop tiene un archivo zip separado en h2o-3.

Para construir H2O con soporte de Hadoop usted mismo, primero instale sphinx para python: pip install sphinxLuego inicie la construcción introduciendo lo siguiente desde el directorio de nivel superior de h2o-3:

(export BUILD_HADOOP=1; ./gradlew build -x test)./gradlew dist

Esto creará un directorio llamado ‘target’ y generará archivos zip allí. Tenga en cuenta que BUILD_HADOOP es el comportamiento por defecto cuando el nombre de usuario es jenkins (consulte settings.gradle); de lo contrario, usted tiene que solicitar, como se muestra arriba.

Agregar soporte para una nueva versión de Hadoop

En el directorio h2o-hadoop, cada versión de Hadoop tiene un directorio de construcción para el controlador y un directorio de montaje para el fatjar.

Usted necesita:

  1. Añadir un nuevo directorio de controladores y un directorio de ensamblaje (cada uno con un archivo build.gradle) en h2o-hadoop
  2. Añadir estos nuevos proyectos a h2o-3/settings.gradle
  3. Añadir la nueva versión de Hadoop a HADOOP_VERSIONS en make-dist.sh
  4. Añadir la nueva versión de Hadoop a la lista en h2o-dist/buildinfo.json

Suplantación segura de usuarios

Hadoop soporta la suplantación segura de usuarios a través de su API Java. Se puede permitir que un usuario autenticado por kerberos suplante cualquier nombre de usuario que cumpla con los criterios especificados introducidos en el archivo core-site.xml del NameNode. Esta suplantación sólo se aplica a las interacciones con la API de Hadoop o las API de los servicios relacionados con Hadoop que la soportan (no es lo mismo que cambiar a ese usuario en la máquina de origen).

Configuración de la suplantación de usuario segura (para h2o):

  1. Crear o encontrar un id para usar como proxy que tenga acceso limitado o nulo a HDFS o servicios relacionados; el usuario proxy sólo debe usarse para suplantar a un usuario
  2. (Necesario si no se usa h2odriver) Si no se usa el driver (e.p. ej. has escrito tu propio código contra la API de h2o usando Hadoop), haz los cambios de código necesarios para suplantar a los usuarios (ver org.apache.hadoop.security.UserGroupInformation)
  3. En Ambari/Cloudera Manager o directamente en el archivo core-site.xml del NameNode, añade 2/3 propiedades para el usuario que deseamos utilizar como proxy (sustitúyelo por el nombre de usuario simple – no el nombre principal completamente calificado).
    • hadoop.proxyuser.<proxyusername>.hosts: los hosts de los que el usuario proxy puede realizar acciones de suplantación en nombre de un usuario válido
    • hadoop.proxyuser.<proxyusername>.groups: los grupos a los que debe pertenecer un usuario suplantado para que la suplantación funcione con ese usuario proxy
    • hadoop.proxyuser.<proxyusername>.users: los usuarios que un usuario proxy puede suplantar
    • Ejemplo: <property> <name>hadoop.proxyuser.myproxyuser.hosts</name> <value>host1,host2</value> </property> <property> <name>hadoop.proxyuser.myproxyuser.groups</name> <value>group1,group2</value> </property> <property> <name>hadoop.proxyuser.myproxyuser.users</name> <value>user1,user2</value> </property>
  4. Reiniciar servicios centrales como HDFS & YARN para que los cambios surtan efecto

Las acciones de HDFS impersonadas pueden verse en el registro de auditoría de hdfs (‘auth:PROXY’ debería aparecer en el campo ugi= en las entradas en las que esto sea aplicable). YARN de manera similar debe mostrar ‘auth:PROXY’ en algún lugar de la interfaz de usuario del gestor de recursos.

Para utilizar la suplantación segura con el controlador Hadoop de h2o:

Antes de que esto se intente, ver Riesgos con la suplantación, a continuación

Cuando se utiliza el h2odriver (e.por ejemplo, cuando se ejecuta con hadoop jar ...), especifique -principal <proxy user kerberos principal>, -keytab <proxy user keytab path> y -run_as_user <hadoop username to impersonate>, además de cualquier otro argumento necesario. Si la configuración fue exitosa, el usuario proxy ingresará y se hará pasar por el -run_as_user siempre y cuando ese usuario esté permitido por la propiedad de configuración de usuarios o grupos (configurada arriba); esto es impuesto por HDFS & YARN, no por el código de h2o. El controlador efectivamente establece su contexto de seguridad como el usuario suplantado por lo que todas las acciones de Hadoop soportadas se llevarán a cabo como ese usuario (por ejemplo, YARN, las APIs de HDFS soportan usuarios suplantados de forma segura, pero otros pueden no hacerlo).

Precauciones a tomar cuando se aprovecha la suplantación segura

  • El caso de uso objetivo para la suplantación segura son las aplicaciones o servicios que pre-autentican a un usuario y luego utilizan (en este caso) el h2odriver en nombre de ese usuario. H2O’s Steam es un ejemplo perfecto: autentificar al usuario en la aplicación web a través de SSL, suplantar a ese usuario cuando se crea el contenedor h2o YARN.
  • El usuario proxy debe tener permisos limitados en el clúster Hadoop; esto significa que no tiene permisos para acceder a los datos o hacer llamadas a la API. De esta manera, si se ve comprometido sólo tendría el poder de suplantar a un subconjunto específico de los usuarios en el clúster y sólo desde máquinas específicas.
  • Utiliza la propiedad hadoop.proxyuser.<proxyusername>.hosts siempre que sea posible o práctico.
  • No des la contraseña o keytab del proxyusername a ningún usuario que no quieras que suplante a otro (esto es generalmente cualquier usuario). El objetivo de la suplantación es no permitir que los usuarios se hagan pasar por otros. Ver el primer punto para el caso de uso típico.
  • Limitar el inicio de sesión del usuario a la máquina desde la que se está realizando la suplantación siempre que sea práctico.
  • Asegurarse de que el keytab utilizado para el inicio de sesión del usuario proxy está correctamente asegurado y que los usuarios no pueden iniciar sesión como ese id (a través de su, por ejemplo)
  • Nunca establecer hadoop.proxyuser..{users,groups} a ‘*’ o ‘hdfs’, ‘yarn’, etc. Permitir que cualquier usuario se haga pasar por hdfs, yarn, o cualquier otro usuario/grupo importante debe hacerse con extrema precaución y analizarse fuertemente antes de permitirlo.

Riesgos con la suplantación segura

  • El id que realiza la suplantación puede ser comprometido como cualquier otro id de usuario.
  • Configurar cualquier propiedad hadoop.proxyuser.<proxyusername>.{hosts,groups,users} a ‘*’ puede aumentar enormemente la exposición al riesgo de seguridad.
  • Cuando los usuarios no se autentican antes de ser utilizados con el controlador (por ejemplo, como hace Steam a través de una app/API web segura), la auditabilidad del proceso/sistema es difícil.

7. Sparkling Water

Sparkling Water combina dos tecnologías de código abierto: Apache Spark y la plataforma H2O Machine Learning. Hace que la biblioteca de algoritmos avanzados de H2O, incluyendo Deep Learning, GLM, GBM, K-Means y Distributed Random Forest, sea accesible desde los flujos de trabajo de Spark. Los usuarios de Spark pueden seleccionar las mejores características de cualquiera de las dos plataformas para satisfacer sus necesidades de Machine Learning. Los usuarios pueden combinar la API RDD de Spark y Spark MLLib con los algoritmos de aprendizaje automático de H2O, o utilizar H2O independientemente de Spark para el proceso de construcción de modelos y post-procesar los resultados en Spark.

Recursos de Sparkling Water:

  • Página de descarga de paquetes preconstruidos
  • Repositorio GitHub de Sparkling Water
  • README
  • Documentación para desarrolladores

8. Documentación

Página web de la documentación

La documentación principal de H2O es la Guía del usuario de H2O. Visite http://docs.h2o.ai para la introducción de nivel superior a la documentación de los proyectos H2O.

Generar la documentación de la API REST

Para generar la documentación de la API REST, utilice los siguientes comandos:

La ubicación predeterminada para la documentación generada es build/docs/REST.

Si la construcción falla, intente gradlew clean, luego git clean -f.

Documentación de la construcción de bleeding edge

La documentación para cada construcción nocturna de bleeding edge está disponible en la página de construcción nocturna.

9. Citar H2O

Si utiliza H2O como parte de su flujo de trabajo en una publicación, por favor cite su(s) recurso(s) H2O utilizando la siguiente entrada BibTex:

H2O Software

Ejemplos de citación de H2O Software con formato:

Folletos de H2O

Los folletos de algoritmos de H2O están disponibles en la página de inicio de la documentación.

@Manual{h2o_booklet_name, title = {booklet_title}, author = {list_of_authors}, year = {year}, month = {month}, url = {link_url},}

Ejemplos de citación de folletos con formato:

10. Hoja de ruta

H2O 3.34.0.1 – Enero 2021

  • Algoritmo de bosque de aislamiento extendido
  • Árboles de elevación
  • Extracción de &interacciones de características de clasificación de los modelos GBM y XGBoost
  • RuleFit MOJO, CoxPH MOJO
  • Soporte para MOJO2 Scoring
  • Grid-Search fault Tolerance
  • Kubernetes Operator
  • Externalized XGBoost on Kubernetes clusters

11. Comunidad

H2O ha sido construido por un gran número de contribuyentes a lo largo de los años tanto dentro de H2O.ai (la empresa) como de la gran comunidad de código abierto. Puedes empezar a contribuir a H2O respondiendo a las preguntas de Stack Overflow o presentando informes de errores. Por favor, ¡únete a nosotros!

Equipo & Committers

SriSatish AmbatiCliff ClickTom KraljevicTomas NykodymMichal MalohlavaKevin NormoyleSpencer AielloAnqi FuNidhi MehtaArno CandelJosephine WangAmy WangMax SchloemerRay PeckPrithvi PrabhuBrandon HillJeff GamberaAriel RaoViraj ParmarKendall HarrisAnand AvatiJessica LanfordAlex TellezAllison WashburnAmy WangErik EckstrandNeeraja MadabhushiSebastian VidrioBen SabrinMatt DowleMark LandryErin LeDellAndrey SpiridonovOleg RogynskyyNick MartinNancy JordanNishant KaloniaNadine HussamiJeff CramerStacie SpreitzerVinod IyengarCharlene WindomParag SanghaviNavdeep GillLauren DiPernaAnmol BalMark ChanNick KarpovAvni WadhwaAshrith BarthurKaren HayrapetyanJo-fai ChowDmitry LarkoBranden MurrayJakub HavaWen PhanMagnus StensmoPasha StetsenkoAngela BartzMateusz DymczykMicah StubbsIvy WangTerone WardLeland WilkinsonWendy WongNikhil ShekharPavel PscheidlMichal KurkaVeronika MaurerovaJan SterbaJan JendrusakSebastien PoirierTomáš Frýda

Asesores

Consejo Asesor Científico

Stephen BoydRob TibshiraniTrevor Hastie

Sistemas, Datos, Sistemas de Archivos y Hadoop

Doug LeaChris PouliotDhruba Borthakur

Inversores

Jishnu Bhattacharjee, Nexus Venture PartnersAnand Babu PeriasamyAnand RajaramanAsh BhardwajRakesh MathurMichael MarksEgbert BiermanRajesh Ambati

Deja una respuesta

Tu dirección de correo electrónico no será publicada.