機器學習-特徵工程-特徵預處理

七月 5, 2018 Python機器學習

Introduction 特徵預處理通常是對數據進行處理通過特定的統計方法(數學方法) 將數據轉換成演算法要求的數據特徵預處理數值型數據：採用標準縮放分為歸一化(normalization) 及標準化(standardization) 兩種,通常也要同時處理缺失值類別型的數據：one-hot編碼時間類型數據：對時間進行切分使用sklearn自帶的特徵預處理API進行處理

Continue Reading →

機器學習-特徵工程-字典特徵抽取(feature extraction)

七月 5, 2018 Python機器學習

機器學習機器學習是從數據(data)中自動分析獲得模型(model)，並利用規律對未知的數據進行預測(predict) 數據和特徵決定了機器學習的上限，而模型和算法只是逼近這個上限而已

Continue Reading →

機器學習-特徵工程-文本特徵抽取

七月 5, 2018 Python機器學習

文本特徵抽取對文本數據進行特徵值化把單詞出現的次數作為特徵對文本進行特徵值化使用sklearn.feature_extraction.text.CountVectorizer 應用場景：文本分類、情感分析

Continue Reading →

(補充)修復bug分支

七月 2, 2018 Git

保存當前分支的工作區狀態(stash)當你接到修復一個代號001的bug任務時，但是當前在dev分支上的工作還沒完成，也不能進行提交git提供了一個stash功能，可將當前的工作現場＂保存＂起來，待以後恢復現場再繼續工作

Continue Reading →

Git基礎使用2

六月 27, 2018 Git

返回過去版本在我們不斷更新原代碼的過程中，有可能還未完成，但是項目必須本機持續work，因此只能先運行過去的版本，必須將本機的專案返回到過去的狀態

Continue Reading →

Git基礎使用

六月 25, 2018 Git

建立git庫在當前的文件夾下建立git庫(初始化一個git數據庫)1git init 使用此命令後當前文件夾下的所有文件均能進行版本管理當前文件夾下會多一個.git文件夾

Continue Reading →

MongoDB學習筆記-文檔的方法(持續新增...)

五月 29, 2018 MongoDB

文檔的排序(sort)只要對象是文檔(Document)，就能調用.sort()方法進行排序調用方法使用. 語法：1文檔對象.sort({字段:1/-1}); 參數為一json對象按照字段之值進行文檔排序並返回 1為升序排列，-1為降序排列 example:123db.class.find( {},{_id:0}).sort({"studentID":1});

Continue Reading →

MongoDB學習筆記-文檔更新(update)

五月 29, 2018 MongoDB

文檔更新 update()方法為集合對象所調用(同find及findOne) 其功能較為複雜可參考官方文檔：https://docs.mongodb.com/manual/reference/method/db.collection.update/ 語法12345db.集合名.update( {filter}, {update}, option,); filter(過濾器)：更新前的文檔定位，相當於關係型數據庫的WHERE update：更新哪些字段，做了哪些更新操作 option: 其他更新選項

Continue Reading →

MongoDB學習筆記-依條件搜尋文檔

五月 28, 2018 MongoDB

條件搜尋文檔 find({字段:條件})括號中輸入的參數為json對象，為取文檔之條件

Continue Reading →

MongoDB學習筆記-集合及文檔的簡易操作

五月 27, 2018 MongoDB

集合(collection)相關操作修改集合名1db.原集合名.renameCollection("修改集合名"); 將原集合名改為修改後的集合名刪除集合1db.集合名.drop(); 將選定的集合名刪除

Continue Reading →