h2oai / h2o-3

iun. 10, 2021
admin

H2O este o platformă în memorie pentru învățare automată distribuită și scalabilă. H2O utilizează interfețe familiare, cum ar fi R, Python, Scala, Java, JSON și interfața Flow notebook/web, și funcționează fără probleme cu tehnologiile big data, cum ar fi Hadoop și Spark. H2O oferă implementări ale multor algoritmi populari, cum ar fi Generalized Linear Models (GLM), Gradient Boosting Machines (inclusiv XGBoost), Random Forests, Deep Neural Networks, Stacked Ensembles, Naive Bayes, Generalized Additive Models (GAM), Cox Proportional Hazards, K-Means, PCA, Word2Vec, precum și un algoritm complet automat de învățare automată (H2O AutoML).

H2O este extensibil, astfel încât dezvoltatorii pot adăuga transformări de date și algoritmi personalizați la alegere și îi pot accesa prin toți acești clienți. Modelele H2O pot fi descărcate și încărcate în memoria H2O pentru scorare, sau exportate în format POJO sau MOJO pentru scorare extrem de rapidă în producție. Mai multe informații pot fi găsite în Ghidul utilizatorului H2O.

H2O-3 (acest depozit) este cea de-a treia încarnare a H2O și succesorul lui H2O-2.

Cuprins

  • Descărcarea H2O-3
  • Resurse cu sursă deschisă
    • Urmărirea problemelor și solicitări de caracteristici
    • Lista resurselor H2O
  • Utilizarea artefactelor de cod H2O-3 (biblioteci)
  • Constituirea H2O.3
  • Lansarea H2O după construire
  • Constituirea H2O pe Hadoop
  • Apă scânteietoare
  • Documentație
  • Citare H2O
  • Roadmap
  • Comunitate / Consilieri / Investitori

1. Descărcarea H2O-3

În timp ce cea mai mare parte a acestui README este scrisă pentru dezvoltatorii care își fac propriile compilări, majoritatea utilizatorilor H2O doar descarcă și folosesc o versiune pre-construită. Dacă sunteți un utilizator Python sau R, cel mai simplu mod de a instala H2O este prin PyPI sau Anaconda (pentru Python) sau CRAN (pentru R):

Python

pip install h2o

R

install.packages("h2o")

Mai multe informații despre descărcarea &instalarea H2O sunt disponibile în Ghidul utilizatorului H2O.

2. Resurse cu sursă deschisă

Cele mai multe persoane interacționează cu trei sau patru resurse primare cu sursă deschisă: GitHub (pe care l-ați găsit deja), JIRA (pentru rapoarte de erori și urmărirea problemelor), Stack Overflow pentru întrebări specifice codului/software-ului H2O și h2ostream (un grup Google / forum de discuții prin e-mail) pentru întrebări care nu sunt potrivite pentru Stack Overflow. Există, de asemenea, un grup de chat Gitter H2O pentru dezvoltatori, totuși, în scopuri de arhivare & pentru a maximiza accesibilitatea, am prefera ca întrebările standard H2O Q&A să se desfășoare pe Stack Overflow.

2.1 Urmărirea problemelor și solicitări de caracteristici

(Notă: Există un singur sistem de urmărire a problemelor pentru proiect. Problemele GitHub nu sunt activate; trebuie să folosiți JIRA.)

Puteți răsfoi și crea probleme noi în JIRA-ul nostru open source: http://jira.h2o.ai

  • Puteți răsfoi și căuta probleme fără să vă conectați la JIRA:
  • Click pe meniul Issues
  • Click pe Search for issues
  • Pentru a crea o problemă (fie un bug sau o cerere de funcționalitate), vă rugăm să vă creați mai întâi un cont:
    1. Click pe butonul Log In din dreapta sus a ecranului
    2. Click pe Create an acccount lângă partea de jos a căsuței de logare
    3. După ce v-ați creat un cont și v-ați logat, folosiți butonul Create din meniu pentru a crea o problemă
    4. Crearea problemelor H2O-3 în proiectul PUBDEV. (Notă: Întrebările Sparkling Water ar trebui să fie depuse în cadrul proiectului SW.)
  • De asemenea, puteți vota pentru solicitări de caracteristici și/sau alte probleme. Votul poate ajuta H2O să prioritizeze funcțiile care sunt incluse în fiecare versiune.
    1. Accesați pagina H2O JIRA.
    2. Click pe Log In pentru a vă loga sau pentru a crea un cont dacă nu aveți deja unul.
    3. Căutați funcția pe care doriți să o prioritizați sau creați o nouă funcție.
    4. Click pe link-ul Vote for this issue. Acesta se află în partea dreaptă a problemei, sub secțiunea People.

2.2 Lista de resurse H2O

3. Utilizarea artefactelor H2O-3

În fiecare compilare nocturnă se publică artefacte R, Python, Java și Scala într-un depozit specific de compilare. În special, puteți găsi artefacte Java în directorul maven/repo.

Iată un fragment de exemplu de fișier gradle build care utilizează h2o-3 ca dependență. Înlocuiți x, y, z și nnnn cu numere valide.

Referiți-vă la cea mai recentă pagină H2O-3 bleeding edge nightly build pentru informații despre instalarea artefactelor nightly build.

Referiți-vă la depozitul GitHub h2o-droplets pentru un exemplu funcțional de utilizare a artefactelor Java cu gradle.

Nota: Artefactele stabile H2O-3 sunt publicate periodic în Maven Central (faceți clic aici pentru a căuta), dar pot fi substanțial în urma H2O-3 Bleeding Edge nightly builds.

4. Construirea H2O-3

Pentru a începe dezvoltarea H2O este nevoie de JDK 1.7, Node.js, Gradle, Python și R. Utilizăm Gradle wrapper (numit gradlew) pentru a ne asigura că versiunile locale actualizate ale Gradle și ale altor dependențe sunt instalate în directorul de dezvoltare.

4.1. Înainte de construire

Consolidarea h2o necesită un mediu R configurat corespunzător cu pachetele necesare și un mediu Python cu următoarele pachete:

gripcoloramafuturetabulaterequestswheel

Pentru a instala aceste pachete puteți utiliza pip sau conda. dacă aveți probleme la instalarea acestor pachete pe Windows, vă rugăm să urmați secțiunea Instalare pe Windows din acest ghid.

(Notă: Se recomandă utilizarea unui anumit mediu virtual, cum ar fi VirtualEnv, pentru a instala toate pachetele. )

4.2. Construirea din linia de comandă (Quick Start)

Pentru a construi H2O din depozit, efectuați următorii pași.

Rețeta 1: Clonați fresh, construiți, săriți testele și rulați H2O

Rețeta 2: Clonați fresh, construiți și rulați testele (necesită o instalare funcțională a R)

git clone https://github.com/h2oai/h2o-3.gitcd h2o-3./gradlew syncSmalldata./gradlew syncRPackages./gradlew build

Note:

  • Rularea testelor pornește cinci JVM-uri de testare care formează un cluster H2O și necesită cel puțin 8GB de RAM (de preferință 16GB de RAM).
  • Executarea ./gradlew syncRPackages este suportată pe Windows, OS X și Linux și este puternic recomandată, dar nu este necesară. ./gradlew syncRPackages asigură un mediu complet și coerent cu versiuni preaprobate ale pachetelor necesare pentru teste și compilări. Pachetele pot fi instalate manual, dar vă recomandăm să setați o variabilă ENV și să folosiți ./gradlew syncRPackages. Pentru a seta variabila ENV, utilizați următorul format (unde `${WORKSPACE} poate fi orice cale):
mkdir -p ${WORKSPACE}/Rlibraryexport R_LIBS_USER=${WORKSPACE}/Rlibrary

Rețeta 3: Extrageți, curățați, construiți și executați testele

git pull./gradlew syncSmalldata./gradlew syncRPackages./gradlew clean./gradlew build

Note

  • Recomandăm utilizarea ./gradlew clean după fiecare git pull.

  • Săriți testele prin adăugarea -x test la sfârșitul liniei de comandă gradle build. Testele rulează de obicei timp de 7-10 minute pe un laptop Macbook Pro cu 4 procesoare (8 hyperthreads) și 16 GB de RAM.

  • Sincronizarea smalldata nu este necesară după fiecare pull, dar dacă testele eșuează din cauza lipsei fișierelor de date, atunci încercați ./gradlew syncSmalldata ca prim pas de depanare. Sincronizarea smalldata descarcă fișierele de date din AWS S3 în directorul smalldata din spațiul dvs. de lucru. Sincronizarea este incrementală. Nu faceți check-in în aceste fișiere. Directorul smalldata se află în .gitignore. Dacă nu executați niciun test, nu aveți nevoie de directorul smalldata.

  • Executarea ./gradlew syncRPackages este suportată pe Windows, OS X și Linux și este puternic recomandată, dar nu este obligatorie. ./gradlew syncRPackages asigură un mediu complet și coerent cu versiuni preaprobate ale pachetelor necesare pentru teste și compilări. Pachetele pot fi instalate manual, dar vă recomandăm să setați o variabilă ENV și să folosiți ./gradlew syncRPackages. Pentru a seta variabila ENV, utilizați următorul format (unde ${WORKSPACE} poate fi orice cale):

    mkdir -p ${WORKSPACE}/Rlibraryexport R_LIBS_USER=${WORKSPACE}/Rlibrary

Rețeta 4: Doar construirea documentelor

./gradlew clean && ./gradlew build -x test && (export DO_FAST=1; ./gradlew dist)open target/docs-website/h2o-docs/index.html

4.3. Instalare pe Windows

Pasul 1: Descărcați și instalați WinPython.

Din linia de comandă, validați că python folosește pachetul nou instalat folosind which python (sau sudo which python). Actualizați variabila de mediu cu calea WinPython.

Pasul 2: Instalați pachetele Python necesare:
pip install grip 'colorama>=0.3.8' future tabulate wheel
Pasul 3: Instalați JDK

Instalați Java 1.7 și adăugați directorul corespunzător C:\Program Files\Java\jdk1.7.0_65\bin cu java.exe la PATH în variabilele de mediu. Pentru a vă asigura că promptul de comandă detectează versiunea corectă de Java, rulați:

javac -version

Variabila CLASSPATH trebuie, de asemenea, să fie setată în subfolderul lib din JDK:

CLASSPATH=/<path>/<to>/<jdk>/lib
Pasul 4: Se instalează JDK. Instalați Node.js

Instalați Node.js și adăugați la PATH directorul instalat C:\Program Files\nodejs, care trebuie să includă node.exe și npm.cmd, dacă nu este deja preapreciat.

Pasul 5. Instalați R, pachetele necesare și Rtools:

Instalați R și adăugați directorul bin la PATH dacă nu este deja inclus.

Instalați următoarele pachete R:

  • RCurl
  • jsonlite
  • statmod
  • devtools
  • roxygen2
  • testthat

Pentru a instala aceste pachete din cadrul unei sesiuni R:

Rețineți că libcurl este necesar pentru instalarea pachetului RCurl R.

Rețineți că aceste pachete nu acoperă rularea testelor, ele sunt doar pentru construirea H2O.

În cele din urmă, instalați Rtools, care este o colecție de instrumente în linie de comandă pentru a facilita dezvoltarea R pe Windows.

NOTA: În timpul instalării Rtools, nu instalați Cygwin.dll.

Pasul 6. Instalați Cygwin

NOTA: În timpul instalării Cygwin, deselectați pachetele Python pentru a evita un conflict cu pachetul Python.org.

Pasul 6b. Validarea Cygwin

Dacă Cygwin este deja instalat, eliminați pachetele Python sau asigurați-vă că Native Python se află înaintea lui Cygwin în variabila PATH.

Pasul 7. Actualizați sau validați variabila PATH din Windows pentru a include R, Java JDK, Cygwin.
Pasul 8. Clonarea Git h2o-3

Dacă nu aveți deja un client Git, vă rugăm să instalați unul. Cel implicit poate fi găsit aici http://git-scm.com/downloads. Asigurați-vă că suportul pentru prompt de comandă este activat înainte de instalare.

Download and update h2o-3 source codes:

git clone https://github.com/h2oai/h2o-3
Pasul 9. Rulați compilarea gradle de nivel superior:

cd h2o-3./gradlew.bat build

Dacă întâmpinați erori rulați din nou cu --stacktrace pentru mai multe instrucțiuni privind dependențele lipsă.

4.4. Instalare pe OS X

Dacă nu aveți Homebrew, vă recomandăm să îl instalați. Acesta face ca gestionarea pachetelor pentru OS X să fie ușoară.

Pasul 1. Instalați JDK

Instalați Java 1.7. Pentru a vă asigura că promptul de comandă detectează versiunea corectă de Java, rulați:

javac -version
Pasul 2. Instalați Node.js:

Utilizați Homebrew:

brew install node

În caz contrar, instalați de pe site-ul NodeJS.

Pasul 3. Instalați R și pachetele necesare:

Instalați R și adăugați directorul bin la PATH, dacă nu este deja inclus.

Instalați următoarele pachete R:

  • RCurl
  • jsonlite
  • statmod
  • devtools
  • roxygen2
  • testthat

Pentru a instala aceste pachete din cadrul unei sesiuni R:

Rețineți că libcurl este necesar pentru instalarea pachetului RCurl R.

Rețineți că aceste pachete nu acoperă rularea testelor, ele sunt doar pentru construirea H2O.

Pasul 4. Instalați python și pachetele necesare:

Instalați python:

brew install python

Instalați managerul de pachete pip:

sudo easy_install pip

În continuare instalați pachetele necesare:

sudo pip install wheel requests 'colorama>=0.3.8' future tabulate 
Pasul 5. Clonare Git h2o-3

OS X ar trebui să aibă deja instalat Git. Pentru a descărca și actualiza codurile sursă h2o-3:

git clone https://github.com/h2oai/h2o-3
Pasul 6. Rulați gradle build de nivel superior:
cd h2o-3./gradlew build

Nota: pe o mașină obișnuită poate dura foarte mult timp (aproximativ o oră) pentru a rula toate testele.

Dacă întâmpinați erori rulați din nou cu --stacktrace pentru mai multe instrucțiuni privind dependențele lipsă.

4.5. Configurare pe Ubuntu 14.04

Pasul 1. Instalați Node.js
curl -sL https://deb.nodesource.com/setup_0.12 | sudo bash -sudo apt-get install -y nodejs
Pasul 2. Instalați JDK:

Instalați Java 8. Instrucțiunile de instalare pot fi găsite aici Instalarea JDK. Pentru a vă asigura că promptul de comandă detectează versiunea corectă de Java, rulați:

javac -version
Pasul 3. Instalați R și pachetele necesare:

Instrucțiunile de instalare pot fi găsite aici Instalarea R. Faceți clic pe „Download R for Linux” (Descărcați R pentru Linux). Faceți clic pe „ubuntu”. Urmați instrucțiunile date.

Pentru a instala pachetele necesare, urmați aceleași instrucțiuni ca și pentru OS X de mai sus.

Nota: Dacă procesul nu reușește să instaleze RStudio Server pe Linux, rulați unul dintre următoarele:

sudo apt-get install libcurl4-openssl-dev

sau

sudo apt-get install libcurl4-gnutls-dev

Pasul 4. Git Clonează h2o-3

Dacă nu ai deja un client Git:

sudo apt-get install git

Download and update h2o-3 source codes:

git clone https://github.com/h2oai/h2o-3
Pasul 5. Rulați compilarea gradle de nivel superior:
cd h2o-3./gradlew build

Dacă întâmpinați erori, rulați din nou folosind --stacktrace pentru mai multe instrucțiuni privind dependențele lipsă.

Asigurați-vă că nu rulați ca root, deoarece bower va respinge o astfel de rulare.

4.6. Configurarea pe Ubuntu 13.10

Pasul 1. Instalați Node.js
curl -sL https://deb.nodesource.com/setup_10.x | sudo bash -sudo apt-get install -y nodejs
Pașii 2-4. Urmați pașii 2-4 pentru Ubuntu 14.04 (mai sus)

4.7. Instalare pe CentOS 7

5. Lansarea H2O după compilare

Pentru a porni clusterul H2O la nivel local, executați următoarele pe linia de comandă:

java -jar build/h2o.jar

O listă cu opțiunile JVM de pornire disponibile și cu opțiunile H2O (de exemplu, -Xmx, -nthreads, -ip), este disponibilă în Ghidul utilizatorului H2O.

6. Construirea H2O pe Hadoop

Filele zip H2O-on-Hadoop pre-construite sunt disponibile pe pagina de descărcare. Fiecare versiune de distribuție Hadoop are un fișier zip separat în h2o-3.

Pentru a construi singur H2O cu suport Hadoop, instalați mai întâi sphinx pentru python: pip install sphinxApoi începeți compilarea introducând următoarele din directorul de nivel superior h2o-3:

(export BUILD_HADOOP=1; ./gradlew build -x test)./gradlew dist

Aceasta va crea un director numit ‘target’ și va genera fișiere zip acolo. Rețineți că BUILD_HADOOP este comportamentul implicit atunci când numele de utilizator este jenkins (consultați settings.gradle); în caz contrar, trebuie să îl solicitați, așa cum se arată mai sus.

Adăugarea suportului pentru o nouă versiune de Hadoop

În directorul h2o-hadoop, fiecare versiune Hadoop are un director de construcție pentru driver și un director de asamblare pentru fatjar.

Trebuie să:

  1. Adaugați un nou director de driver și un nou director de asamblare (fiecare cu un fișier build.gradle) în h2o-hadoop
  2. Adaugați aceste noi proiecte la h2o-3/settings.gradle
  3. Adaugați noua versiune Hadoop la în make-dist.sh
  4. Adaugați noua versiune Hadoop la lista din h2o-dist/buildinfo.json

Impersonificarea securizată a utilizatorului

Hadoop suportă impersonarea securizată a utilizatorului prin API-ul său Java. Unui utilizator autentificat prin Kerberos i se poate permite să împuternicească orice nume de utilizator care îndeplinește criteriile specificate introduse în fișierul core-site.xml al NameNode. Această personificare se aplică numai la interacțiunile cu API-ul Hadoop sau cu API-urile serviciilor legate de Hadoop care o acceptă (nu este același lucru cu trecerea la acel utilizator pe mașina de origine).

Configurarea impersonării securizate a utilizatorului (pentru h2o):

  1. Creați sau găsiți un id care să fie folosit ca proxy care are acces limitat sau nu are acces la HDFS sau la serviciile conexe; utilizatorul proxy trebuie să fie folosit doar pentru a impersona un utilizator
  2. (Necesar dacă nu folosiți h2odriver) Dacă nu folosiți driverul (de ex.g. v-ați scris propriul cod împotriva API-ului h2o folosind Hadoop), efectuați modificările de cod necesare pentru a impersona utilizatorii (a se vedea org.apache.hadoop.security.UserGroupInformation)
  3. În Ambari/Cloudera Manager sau direct în fișierul core-site.xml al NameNode, adăugați 2/3 proprietăți pentru utilizatorul pe care dorim să îl folosim ca proxy (înlocuiți cu numele de utilizator simplu – nu cu numele principal complet calificat).
    • hadoop.proxyuser.<proxyusername>.hosts: gazdele pe care utilizatorul proxy are voie să efectueze acțiuni impersonate în numele unui utilizator valid din
    • hadoop.proxyuser.<proxyusername>.groups: grupurile din care trebuie să facă parte un utilizator impersonat pentru ca impersonarea să funcționeze cu acel utilizator proxy
    • hadoop.proxyuser.<proxyusername>.users: utilizatorii pe care un utilizator proxy are voie să îi impersoneze
    • Exemplu: <property> <name>hadoop.proxyuser.myproxyuser.hosts</name> <value>host1,host2</value> </property> <property> <name>hadoop.proxyuser.myproxyuser.groups</name> <value>group1,group2</value> </property> <property> <name>hadoop.proxyuser.myproxyuser.users</name> <value>user1,user2</value> </property>
  4. Reporniți serviciile de bază, cum ar fi HDFS & YARN pentru ca modificările să intre în vigoare

Acțiunile HDFS impersonate pot fi vizualizate în jurnalul de audit hdfs („auth:PROXY” ar trebui să apară în câmpul ugi= în intrările în care acest lucru este aplicabil). În mod similar, YARN ar trebui să afișeze ‘auth:PROXY’ undeva în interfața de utilizare a managerului de resurse.

Pentru a utiliza impersonarea securizată cu driverul Hadoop al h2o:

Înainte de a încerca acest lucru, consultați secțiunea Riscuri cu impersonarea, de mai jos

Când se utilizează driverul h2odriver (de ex.ex. atunci când se execută cu hadoop jar ...), specificați -principal <proxy user kerberos principal>, -keytab <proxy user keytab path> și -run_as_user <hadoop username to impersonate>, în plus față de orice alte argumente necesare. Dacă configurarea a avut succes, utilizatorul proxy se va autentifica și va impersona -run_as_user atâta timp cât acel utilizator este permis fie de proprietatea de configurare users sau groups (configurată mai sus); acest lucru este impus de HDFS & YARN, nu de codul h2o. Driverul își setează efectiv contextul de securitate ca fiind utilizatorul impersonat, astfel încât toate acțiunile Hadoop suportate vor fi efectuate ca acel utilizator (de exemplu, YARN, API-urile HDFS acceptă utilizatorii impersonați în siguranță, dar este posibil ca altele să nu).

Precauții de luat atunci când se utilizează impersonarea securizată

  • Cazul de utilizare vizat pentru impersonarea securizată este reprezentat de aplicațiile sau serviciile care pre-autentifică un utilizator și apoi utilizează (în acest caz) driverul h2odriver în numele acelui utilizator. H2O’s Steam este un exemplu perfect: autentificați utilizatorul în aplicația web prin SSL, impersonați acel utilizator atunci când creați containerul h2o YARN.
  • Utilizatorul proxy ar trebui să aibă permisiuni limitate în clusterul Hadoop; acest lucru înseamnă că nu are permisiuni de a accesa date sau de a efectua apeluri API. În acest fel, în cazul în care este compromis, ar avea puterea de a impersona doar un subset specific de utilizatori din cluster și doar de la anumite mașini.
  • Utilizați proprietatea hadoop.proxyuser.<proxyusername>.hosts ori de câte ori este posibil sau practic.
  • Nu dați parola sau keytab-ul proxyusername unui utilizator pe care nu doriți să impersoneze un alt utilizator (în general, acesta este orice utilizator). Scopul impersonării nu este de a permite utilizatorilor să se substituie unul altuia. A se vedea primul punct pentru cazul tipic de utilizare.
  • Limitați autentificarea utilizatorului la mașina de pe care are loc proxy-ul ori de câte ori este practic.
  • Asigurați-vă că keytab-ul utilizat pentru autentificarea utilizatorului proxy este securizat corespunzător și că utilizatorii nu se pot autentifica ca acel id (prin su, de exemplu)
  • Nu setați niciodată hadoop.proxyuser..{users,groups} la ‘*’ sau ‘hdfs’, ‘yarn’, etc. Permiterea oricărui utilizator să se dea drept hdfs, yarn sau orice alt utilizator/grup important ar trebui făcută cu extremă precauție și analizată puternic înainte de a fi permisă.

Riscuri cu impersonarea securizată

  • Id-ul care efectuează impersonarea poate fi compromis ca orice alt id de utilizator.
  • Setarea oricărei proprietăți hadoop.proxyuser.<proxyusername>.{hosts,groups,users} la ‘*’ poate crește foarte mult expunerea la riscuri de securitate.
  • Când utilizatorii nu sunt autentificați înainte de a fi utilizați cu driverul (de exemplu, așa cum face Steam prin intermediul unei aplicații web/API securizate), auditabilitatea procesului/sistemului este dificilă.

7. Sparkling Water

Sparkling Water combină două tehnologii open-source: Apache Spark și platforma H2O Machine Learning. Aceasta face ca biblioteca H2O de algoritmi avansați, inclusiv Deep Learning, GLM, GBM, K-Means și Distributed Random Forest, să fie accesibilă din fluxurile de lucru Spark. Utilizatorii Spark pot selecta cele mai bune caracteristici din oricare dintre platforme pentru a răspunde nevoilor lor de Machine Learning. Utilizatorii pot combina API RDD și Spark MLLib de la Spark cu algoritmii de învățare automată de la H2O sau pot utiliza H2O independent de Spark pentru procesul de construire a modelelor și post-procesarea rezultatelor în Spark.

Resurse Sparkling Water:

  • Pagină de descărcare pentru pachetele pre-construite
  • Rezervația GitHub Sparkling Water
  • README
  • Documentația dezvoltatorului

8. Documentație

Pagina de pornire a documentației

Documentația principală a H2O este Ghidul utilizatorului H2O. Vizitați http://docs.h2o.ai pentru introducerea de nivel superior la documentația proiectelor H2O.

Generate REST API documentation

Pentru a genera documentația REST API, utilizați următoarele comenzi:

Locația implicită pentru documentația generată este build/docs/REST.

Dacă generarea nu reușește, încercați gradlew clean, apoi git clean -f.

Documentația de construire bleeding edge

Documentația pentru fiecare construire nocturnă bleeding edge este disponibilă pe pagina de construire nocturnă.

9. Citarea H2O

Dacă utilizați H2O ca parte a fluxului dvs. de lucru într-o publicație, vă rugăm să citați resursele H2O utilizând următoarea intrare BibTex:

H2O Software

Exemple de citare a H2O Software formatate:

H2O Booklets

H2O algorithm booklets sunt disponibile pe pagina de pornire a documentației.

@Manual{h2o_booklet_name, title = {booklet_title}, author = {list_of_authors}, year = {year}, month = {month}, url = {link_url},}

Exemple de citare a broșurilor formatate:

10. Foaie de parcurs

H2O 3.34.0.1 – ianuarie 2021

    • Extended Isolation Forest Algorithm
    • Uplift Trees
    • Extragerea & interacțiunilor caracteristicilor de clasificare din modelele GBM și XGBoost
    • RuleFit MOJO, CoxPH MOJO
    • Suport pentru MOJO2 Scoring
    • Grid-Search fault Tolerance
    • Kubernetes Operator
    • XGBoost externalizat pe clusterele Kubernetes

    11. Comunitate

    H2O a fost construită de un număr mare de contribuitori de-a lungul anilor, atât în cadrul H2O.ai (compania), cât și în cadrul comunității open source în general. Puteți începe să contribuiți la H2O răspunzând la întrebările de pe Stack Overflow sau înregistrând rapoarte de erori. Vă rugăm să vă alăturați nouă!

    Team & Committers

SriSatish AmbatiCliff ClickTom KraljevicTomas NykodymMichal MalohlavaKevin NormoyleSpencer AielloAnqi FuNidhi MehtaArno CandelJosephine WangAmy WangMax SchloemerRay PeckPrithvi PrabhuBrandon HillJeff GamberaAriel RaoViraj ParmarKendall HarrisAnand AvatiJessica LanfordAlex TellezAllison WashburnAmy WangErik EckstrandNeeraja MadabhushiSebastian VidrioBen SabrinMatt DowleMark LandryErin LeDellAndrey SpiridonovOleg RogynskyyNick MartinNancy JordanNishant KaloniaNadine HussamiJeff CramerStacie SpreitzerVinod IyengarCharlene WindomParag SanghaviNavdeep GillLauren DiPernaAnmol BalMark ChanNick KarpovAvni WadhwaAshrith BarthurKaren HayrapetyanJo-fai ChowDmitry LarkoBranden MurrayJakub HavaWen PhanMagnus StensmoPasha StetsenkoAngela BartzMateusz DymczykMicah StubbsIvy WangTerone WardLeland WilkinsonWendy WongNikhil ShekharPavel PscheidlMichal KurkaVeronika MaurerovaJan SterbaJan JendrusakSebastien PoirierTomáš Frýda

Advisors

Scientific Advisory Council

Stephen BoydRob TibshiraniTrevor Hastie

Systems, Data, FileSystems and Hadoop

Doug LeaChris PouliotDhruba Borthakur

Investors

Jishnu Bhattacharjee, Nexus Venture PartnersAnand Babu PeriasamyAnand RajaramanAsh BhardwajRakesh MathurMichael MarksEgbert BiermanRajesh Ambati

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.