Inanunsyo ng Microsoft ang bersyon ng Mga Application sa Science sa 0.11

Data Scientists sa Microsoft ay inihayag ng isang maagang publiko preview ng Proseso ng Agham ng Data ng Team (TDSP) upang suportahan ang ligtas na pakikipagtulungan sa loob ng samahan ng agham ng data ng negosyo. Gamit nito, tutulungan ng TDSP ang mga gumagamit na istraktura ang kanilang mga datos at proyekto sa agham sa pamamagitan ng pagpapadali sa hanay ng mga pamantayang Git repository, mga template ng dokumento at mga utility na may kaugnayan depende sa lifecycle ng proyekto. Ang pinakamagandang bahagi ay ang koponan ay lumikha ng isang hiwalay na imbakan ng mga kagamitan upang mapalakas ang pagiging produktibo ng agham ng data.

Mga Utility sa Data Science

Mga Utility sa Data Science

Ang Interactive Data Pagsaliksik, Pagtatasa, at Pag-uulat (IDEAR) ay magbibigay-daan sa siyentipiko ng data upang galugarin at mailarawan ang isang set ng data nang interactive habang ang Automated Modeling at Pag-uulat (AMAR) ay mag-aalok ng pagsasanay sa modelo ng baseline, modelo ng pagwawalis at pag-aayos din ng parameter. Ang koponan ng TDSP ay nagtipon ng puna mula sa mga siyentipiko ng data at bilang isang resulta ay dumating sa mga bagong tampok kasama ang mga improvisasyon sa umiiral na.

Ang R at Python na wika ay malawak na ginagamit para sa analytics at agham ng data, at ngayon ang koponan ay naglabas ng IDEAR sa Jupyter Notebook. Hahayaan nito ang mga siyentipiko ng data na mas gusto ang Python na mailarawan ang data at magamit ang mga pag-andar ng IDEAR. Bukod dito, maaari ring i-upload ng mga gumagamit ang Jupyter Notebook sa isang server ng Jupyter Notebook at simulan ang pagsisiyasat sa set ng data sa pamamagitan ng pag-set up ng gumaganang direktoryo sa Jupyter Notebook.

Bukod sa Python ang IDEAR sa R ​​ay matagumpay na makuha ang mga bahagi ng oras ng oras mula sa mga patlang ng petsa-oras na awtomatiko. Nangangahulugan ito na ang mga siyentipiko ng data ay hindi na kailangang magsulat ng code upang kunin ang mga sangkap ng dateline kabilang ang taon, buwan, araw ng linggo at gamitin ang mga ito bilang mga dagdag na variable para sa anumang karagdagang pagsusuri. Gayundin, ang IDEAR sa R ​​ay gagana sa mga pinahusay na mga datasets na magpapahintulot sa mga siyentipiko ng data na mailarawan at makakuha ng mga pananaw sa dinamika ng mga bahagi at oras na bahagi, na nauugnay sa mga variable na target.

Ang iba pang mga bagong tampok ay may kasamang hiwa sa tsart ng pie upang mapahusay ang kakayahang mabasa. Ang IDEAR sa parehong R at ang Python ay maaaring madaling tumakbo sa Azure Data Science Virtual Machine (DSVM) at ang estilo ng coding ay naging mas pare-pareho. Para sa higit pa tungkol dito, bisitahin ang Technet.

pinagmulan

Ipagkalat ang pag-ibig

Mag-iwan ng komento