本文的標(biāo)題是《可視化 | 如何制作“文字云”(Words Cloud)效果呢?》來源于:由作者:陳開啟采編而成,主要講述了“ 想起來2018年已過去近半,想起來年初總結(jié)挖下的坑還基本沒填,現(xiàn)在開始第一
“ 想起來2018年已過去近半,想起來年初總結(jié)挖下的坑還基本沒填,現(xiàn)在開始第一更,目標(biāo)是先把去年的坑填完吧。”
什么是文字云呢?它的英文其實是words cloud,是可視化的一種表現(xiàn)形式,一般用來直觀展示大段文字中詞語出現(xiàn)的頻率。
那其實涉及到兩個問題,一個是一大段的文字怎么分成相對**的一個個單詞?另一個是如何統(tǒng)計每個詞語出現(xiàn)的頻率并依據(jù)頻率來可視化呈現(xiàn)?
先說結(jié)論:
文字云可視化:https://wordart.com
在線分詞:http://www.78901.net/participle/
01 文字云可視化
其實有很多在線的網(wǎng)站可以實現(xiàn)“文字云”的效果,最初接觸的時候我用的是tagxedo這個網(wǎng)站(http://www.tagxedo.com/app.html),大概在2013年左右,最初還不需要**就可以登上,特點(diǎn)是支持中文,但現(xiàn)在這個網(wǎng)站需要科學(xué)上網(wǎng)才能使用,所以不推薦再用。
下面是之前用tagxedo做的一些案例:
比如摳圖后結(jié)合項目理念用來作為封面——
比如利用關(guān)鍵詞做成鳥瞰圖的襯底做封面——
沒有tagxedo后其實有更好的選擇,就是上面提到的wordart網(wǎng)站(完整網(wǎng)址是:https://wordart.com),可以直接訪問,不需要**。
制作步驟也很簡單,跟tagxedo的邏輯是一樣的,頁面左側(cè)分為words、shapes、fonts、layout和style,右側(cè)是文字云生成界面,基本上就是“插入文字——可視化——自定義樣式”三步。
words——插入需要生成為文字云的文字,值得提醒的是wordart網(wǎng)站支持導(dǎo)入csv格式的文件,那么有什么優(yōu)勢呢?這樣說吧,excel格式的表格xls最大支持6553行,xlsx最大支持1048576行,而csv格式其實和txt一樣,是屬于純文本文件,是沒有行數(shù)限制的。
shapes——不用多說,支持添加自定義的形狀文件,建議做成黑白對比的png圖導(dǎo)入。
fonts——字體,如果要生成中文的話需要自己上傳中文字體,不然默認(rèn)都是英文字體,導(dǎo)入中文是生成不了的。
layout——輸出,建議導(dǎo)出png格式。
style——主題樣式,可以選擇各種配色,多試兩次就能了解。
02 中文分詞
為什么要分詞呢?
其實也很好理解,不分詞的話全都是一段一段的話,無法統(tǒng)計單個詞語出現(xiàn)的頻率,分詞就是為了更好地統(tǒng)計不同的詞語。
在線分詞網(wǎng)站其實不止http://www.78901.net/participle/,之外還有很多很多,基本上都大同小異,輸入一段文本后會自動生成分詞完的結(jié)果。
導(dǎo)入到wordart網(wǎng)站的words里面后可以看到各個詞語的詞頻。
然后會自動根據(jù)詞頻生成文字云的效果,如下:
其實**作上不需要講太多,網(wǎng)上也很多教程,我覺得更重要的是摸索一些應(yīng)用方向,現(xiàn)在多集中在:問卷調(diào)查中主觀題目的可視化展示、封面或?qū)n}圖的制作這兩個方面,但我認(rèn)為應(yīng)該能夠有更多發(fā)揮的空間。
比如可以通過網(wǎng)絡(luò)爬取類似大眾點(diǎn)評的店鋪點(diǎn)評數(shù)據(jù),將其存儲成csv格式文件導(dǎo)入并迅速生成該店鋪的評論文字云,可以很直觀地體現(xiàn)出點(diǎn)評的關(guān)注點(diǎn)集中在哪里。
更多的是需要發(fā)揮自己的想象力。
暫時介紹到這里,希望能夠幫助到需要的人,以上。
P.S.小小期待下端午節(jié)的十年城規(guī)聚會。
歡迎關(guān)注公眾號:平紙雜貨鋪
本文原作者為陳開啟,轉(zhuǎn)載請注明:出處!如該文有不妥之處,請聯(lián)系站長刪除,謝謝合作~
原創(chuàng)文章,作者:陳開啟,如若轉(zhuǎn)載,請注明出處:http://www.uuuxu.com/20220512316187.html