本文的標題是《可視化 | 如何制作“文字云”(Words Cloud)效果呢?》來源于:由作者:陳開啟采編而成,主要講述了“ 想起來2018年已過去近半,想起來年初總結挖下的坑還基本沒填,現在開始第一
“ 想起來2018年已過去近半,想起來年初總結挖下的坑還基本沒填,現在開始第一更,目標是先把去年的坑填完吧。”
什么是文字云呢?它的英文其實是words cloud,是可視化的一種表現形式,一般用來直觀展示大段文字中詞語出現的頻率。
那其實涉及到兩個問題,一個是一大段的文字怎么分成相對**的一個個單詞?另一個是如何統計每個詞語出現的頻率并依據頻率來可視化呈現?
先說結論:
文字云可視化:https://wordart.com
在線分詞:http://www.78901.net/participle/
01 文字云可視化
其實有很多在線的網站可以實現“文字云”的效果,最初接觸的時候我用的是tagxedo這個網站(http://www.tagxedo.com/app.html),大概在2013年左右,最初還不需要**就可以登上,特點是支持中文,但現在這個網站需要科學上網才能使用,所以不推薦再用。
下面是之前用tagxedo做的一些案例:
比如摳圖后結合項目理念用來作為封面——
比如利用關鍵詞做成鳥瞰圖的襯底做封面——
沒有tagxedo后其實有更好的選擇,就是上面提到的wordart網站(完整網址是:https://wordart.com),可以直接訪問,不需要**。
制作步驟也很簡單,跟tagxedo的邏輯是一樣的,頁面左側分為words、shapes、fonts、layout和style,右側是文字云生成界面,基本上就是“插入文字——可視化——自定義樣式”三步。
words——插入需要生成為文字云的文字,值得提醒的是wordart網站支持導入csv格式的文件,那么有什么優勢呢?這樣說吧,excel格式的表格xls最大支持6553行,xlsx最大支持1048576行,而csv格式其實和txt一樣,是屬于純文本文件,是沒有行數限制的。
shapes——不用多說,支持添加自定義的形狀文件,建議做成黑白對比的png圖導入。
fonts——字體,如果要生成中文的話需要自己上傳中文字體,不然默認都是英文字體,導入中文是生成不了的。
layout——輸出,建議導出png格式。
style——主題樣式,可以選擇各種配色,多試兩次就能了解。
02 中文分詞
為什么要分詞呢?
其實也很好理解,不分詞的話全都是一段一段的話,無法統計單個詞語出現的頻率,分詞就是為了更好地統計不同的詞語。
在線分詞網站其實不止http://www.78901.net/participle/,之外還有很多很多,基本上都大同小異,輸入一段文本后會自動生成分詞完的結果。
導入到wordart網站的words里面后可以看到各個詞語的詞頻。
然后會自動根據詞頻生成文字云的效果,如下:
其實**作上不需要講太多,網上也很多教程,我覺得更重要的是摸索一些應用方向,現在多集中在:問卷調查中主觀題目的可視化展示、封面或專題圖的制作這兩個方面,但我認為應該能夠有更多發揮的空間。
比如可以通過網絡爬取類似大眾點評的店鋪點評數據,將其存儲成csv格式文件導入并迅速生成該店鋪的評論文字云,可以很直觀地體現出點評的關注點集中在哪里。
更多的是需要發揮自己的想象力。
暫時介紹到這里,希望能夠幫助到需要的人,以上。
P.S.小小期待下端午節的十年城規聚會。
歡迎關注公眾號:平紙雜貨鋪
本文原作者為陳開啟,轉載請注明:出處!如該文有不妥之處,請聯系站長刪除,謝謝合作~
原創文章,作者:陳開啟,如若轉載,請注明出處:http://www.uuuxu.com/20220512316187.html