Introduction
特徵預處理通常是對數據進行處理
通過特定的統計方法(數學方法) 將數據轉換成演算法要求的數據
特徵預處理
數值型數據:採用標準縮放 分為歸一化(normalization) 及 標準化(standardization) 兩種,通常也要同時處理缺失值類別型的數據:one-hot編碼時間類型數據:對時間進行切分
使用sklearn自帶的特徵預處理API進行處理
機器學習-特徵工程-字典特徵抽取(feature extraction)
機器學習機器學習是從數據(data)中自動分析獲得模型(model),並利用規律對未知的數據進行預測(predict)
數據和特徵決定了機器學習的上限,而模型和算法只是逼近這個上限而已
機器學習-特徵工程-文本特徵抽取
文本特徵抽取
對文本數據進行特徵值化
把單詞出現的次數作為特徵對文本進行特徵值化
使用sklearn.feature_extraction.text.CountVectorizer
應用場景:文本分類、情感分析
(補充)修復bug分支
保存當前分支的工作區狀態(stash)當你接到修復一個代號001的bug任務時,但是當前在dev分支上的工作還沒完成,也不能進行提交git提供了一個stash功能,可將當前的工作現場"保存"起來,待以後恢復現場再繼續工作
MongoDB學習筆記-文檔的方法(持續新增...)
文檔的排序(sort)只要對象是文檔(Document),就能調用.sort()方法進行排序
調用方法使用.
語法:1文檔對象.sort({字段:1/-1});
參數為一json對象
按照字段之值進行文檔排序並返回
1為升序排列,-1為降序排列
example:123db.class.find( {},{_id:0}).sort({"studentID":1});
MongoDB學習筆記-文檔更新(update)
文檔更新
update()方法為集合對象所調用(同find及findOne)
其功能較為複雜可參考官方文檔:https://docs.mongodb.com/manual/reference/method/db.collection.update/
語法12345db.集合名.update( {filter}, {update}, option,);
filter(過濾器):更新前的文檔定位,相當於 關係型數據庫的WHERE
update:更新哪些字段,做了哪些更新操作
option: 其他更新選項
MongoDB學習筆記-集合及文檔的簡易操作
集合(collection)相關操作修改集合名1db.原集合名.renameCollection("修改集合名");
將原集合名改為修改後的集合名
刪除集合1db.集合名.drop();
將選定的集合名刪除