2020年7月30日 星期四

使用pandas去除資料中的缺失值

當我們要開始作資料分析,一定會遇到碰上有缺失資料的狀況,這個時候,我們就需要用pandas來把包含缺失值的數據刪除。
假設我們現在讀入了一個dataframe df,我們先把空格填入nan
df['<column name A>', '<column name B>'].replace('', np.nan, inplace=True)
 再來就是把是空格的欄位去掉。
df_new = df.dropna(inplace=True)
重設index,(這是為了要走for loop的時候不會出錯,如果只是資料分析其實可以略過)
df_new.reset_index(drop=True, inplace=True)

2020年7月21日 星期二

Chart.js產生帶有百分比的圖表

雖然amChart的圖表真的好看,但是開源的Chart.js有一個無人能擋的功能,就是可以直接右鍵下載。這個真的強。

但是也有美中不足的地方,像是要呈現出百分比,就需要額外的功夫了。

強者網友針對chart.js 2.0之後的版本,寫了code,趕緊來學習下。

https://stackoverflow.com/questions/37257034/chart-js-2-0-doughnut-tooltip-percentages

這則一定趕快存起來,之後絕對用得到。

2020年7月13日 星期一

使用django 產出amCharts.js 所需要的資料格式

最近在趕案子,在前輩的推薦之下,打算拋棄Chart.js 改投向amChart.js。

原因是當div空間不夠時,Chart.js的長條圖例文字會模糊不清。

不過這兩個套件要求的格式完全不同。

我們來看看amChart.js官方網站的長條圖示例。

<!-- Styles --> <style> #chartdiv { width: 100%; height: 500px; } </style> <!-- Resources --> <script src="https://www.amcharts.com/lib/4/core.js"></script> <script src="https://www.amcharts.com/lib/4/charts.js"></script> <script src="https://www.amcharts.com/lib/4/themes/animated.js"></script> <!-- Chart code --> <script> am4core.ready(function() { // Themes begin am4core.useTheme(am4themes_animated); // Themes end // Create chart instance var chart = am4core.create("chartdiv", am4charts.XYChart); // Add data chart.data = [{ "country": "USA", "visits": 2025 }, { "country": "China", "visits": 1882 }, { "country": "Japan", "visits": 1809 }, { "country": "Germany", "visits": 1322 }, { "country": "UK", "visits": 1122 }, { "country": "France", "visits": 1114 }, { "country": "India", "visits": 984 }, { "country": "Spain", "visits": 711 }, { "country": "Netherlands", "visits": 665 }, { "country": "Russia", "visits": 580 }, { "country": "South Korea", "visits": 443 }, { "country": "Canada", "visits": 441 }, { "country": "Brazil", "visits": 395 }]; // Create axes var categoryAxis = chart.xAxes.push(new am4charts.CategoryAxis()); categoryAxis.dataFields.category = "country"; categoryAxis.renderer.grid.template.location = 0; categoryAxis.renderer.minGridDistance = 30; categoryAxis.renderer.labels.template.adapter.add("dy", function(dy, target) { if (target.dataItem && target.dataItem.index & 2 == 2) { return dy + 25; } return dy; }); var valueAxis = chart.yAxes.push(new am4charts.ValueAxis()); // Create series var series = chart.series.push(new am4charts.ColumnSeries()); series.dataFields.valueY = "visits"; series.dataFields.categoryX = "country"; series.name = "Visits"; series.columns.template.tooltipText = "{categoryX}: [bold]{valueY}[/]"; series.columns.template.fillOpacity = .8; var columnTemplate = series.columns.template; columnTemplate.strokeWidth = 2; columnTemplate.strokeOpacity = 1; }); // end am4core.ready() </script> <!-- HTML --> <div id="chartdiv"></div>


Note: Above is the demo code of AmCharts.js

Original site: https://www.amcharts.com/demos/simple-column-chart/

不難發現對Django來說,需要從DB裡面query出所需的Queryset,再轉換成這個套件所需要的格式,需要花上一些時間。

不過確實是好物。

下次再跟大家分享這個部分。

先這樣了,拜。


2020年7月11日 星期六

Django針對欄位計算百分比

https://stackoverflow.com/questions/19286834/django-calculate-percentage-based-on-object-count

以上是原文出處。

基本上,這個回答的重點是在儲存問卷相關值時,其實應該儲存成不同的model class。

<model name>.objects.values('<group by 欄位名稱>').annotate(<計算出來欄位名稱>=Count('id')).order_by()

*SQL裡面你可以group by很多欄位,這裡也可以,例如:Book.objects.values('name', 'code').annotate(count=Count('id')).order_by

這樣會預設按照query結果的第一個欄位排序,例如:name, 而不是計算出來欄位名稱

2020年7月7日 星期二

Django Cheat Sheet

Recently, I came up with the deployment with Django.

Since I have got in the age that needs more record than my memory.

I'll just write them down here.

# create the directory
mkdir <project name>
cd <project name>
# In windows env, initiate virtual env.

python -m venv my_venv
my_venv\Scripts\activate

# Then install django

~/Liang$ pip install "django==3.0.4"

# Create proj folder

(my_venv) ~/Liang$ django-admin startproject mysite

cd mysite

# Create an app. eg.Login, Shopping cart.

(my_venv) ~/Liang/mysite$ python manage.py startapp <app_name>

In mysite/settings.py, add '<app_name>' in installed apps.

Then everything is done.