Statistics

May 29, 2024

自家用車の利用をやめることを決めてから、去年の4月からの普通預金口座残高のグラフを描いてみた。

Screenshot-20240529-at-105651

あるきっかけがあって自家用車の利用をやめることにした。どの程度の経済的効果があるかに関心をもち、自動車税、自動車保険、車検費用、ガソリン代などを計算してみると、車の購入費用を除いても、自動車を維持するための費用は1月当たり約2万円であった。「Make Your Car a Luxury」という考え方を受け入れることになった。

Evaluate whether you live in a place where a car is a luxury or a necessity. Don't use your car a week and explore all kinds of alternative options to stay mobile.
-- Matthias Hollwich
Most of us need cars to get around. But what if we live in a city where everything is within walking distance? In that case, we can manage our lives withoud depending on our ability to drive. In an ideal scenario we can take care of our daily routine with a twenty-minite walk, and meet friends and neighbors on our way.
-- Matthias Hollwich
https://amazon.co.jp/New-Aging-Smarter-Better-Forever/dp/0143128108

|

May 28, 2024

体重が増えてきているのだろうか?

Tempimageuycagk

 

Screenshot-20240528-at-112652 Screenshot-20240528-at-111536

 

```{r}
weight <- c(75.45,75.55,74.80,74.90,74.95,75.15,75.55,75.65,74.95,74.95,75.95,75.55,75.60,75.15,75.15,75.45,75.40)
d <- 12:28
data <- data.frame(day = d, weight= weight)
```

```{r}
plot(data,type="l")
```

```{r}
result <- lm(weight ~ day, data=data)
plot(weight ~ day, data=data)
abline(result)
```

 

|

May 30, 2023

北九州市、町内会、二次的データ、R言語、その他。

「晩年の作法」という言葉があるのかないのかわからない。しかし、歳を取ると制約が少なくなり自由になる面があるが、体力の衰えや収入の減少などがあるので、何をどうやるかをよく考えなければならないことは事実だ。

最近、北九州市の動向に関心を持っている。これは、調べやすいテーマなので続けていこうと思う。市内であっても、市議会の傍聴などに出かけていくのは面倒なので、新聞2紙に目を通して、新聞記者が捉えた北九州市の動向を把握し、疑問に思うことなどを自分で調べてみようと思う。これが、「北九州市の研究」。

次に、自治体よりももっと草の根レベルの「町内会・自治会」について、周りの人に迷惑がかからないように多少は注意しながら調べて考えてみる。2021年度に町内会の会計をやったので、それで知り得た情報がとても貴重なものだと思っている。最近、「ホテルの部屋数で、町内会費が高くなる?!」という西日本新聞記事を目にして、それに読者としてコメントを書いてみた。色々な意見が私以外にも寄せられていておもしろい。「あな特調査依頼」という欄である。「床屋談義」の場所にもなるのではないだろうか。

次に、「Rによる二次的データの分析」。公表されている様々なデータを分析していく。おそらく、北九州市や福岡県についての統計的データを中心に取りあげていくだろう。RStudioで作成したHTMLファイルは、その一部をRPubsで公開している。

あとは、「情報社会論」、「健康と病気」など。これらは、「北九州市の研究」と結びつけ、統計的データを中心にして調べていけば効率的であろうと考えている。

いつまで続くかはわからない。「成果」は、ココログではなくnote.comの方で公表していく予定である。


|

May 22, 2023

RPubsというサイト

Screenshot-20230522-at-151218

RPubsというサイトは、便利だ。RStudioからpublishやrepublishができる。
ここにアップロードしたファイルは、Googleの検索にも引っかかりやすいようだ。「調査データの整理」を検索するとRPubsが3番目に出てくる。

Screenshot-20230522-at-151735

「調査データの整理」は、「『平成17年社会調査実習報告書』の思い出」という記事をnoteで書いたときに使ったRマークダウンファイルを実行したものである。

|

May 04, 2023

PDFには確かに不便なところがあるが、その不便なところに長所も含まれている。

PDFs are bad for data visualization and storytelling – but what’s the alternative?

The easiest solution is your website. Publishing a digital report as an HTML page allows you to create stunning content that’s easy to share and analyze. Web pages are the best audience-centric choice thanks to their cross-device optimization, interactive possibilities and shareable nature. Besides, with the plethora of third-party tools widely available, it is now possible to create digital content without any coding involved.

With Flourish, you can create beautiful interactive stories that could be embedded into your webpage in a matter of seconds. Whether you work on annual reports or present industry findings, inspiration is everywhere!

最近インターネット上で「A Flourish chart」という文字がグラフの右下に出てくる記事があって関心を持った。便利なツールのように思うが、使ってみるべきかどうかを検討することにしたい。おそらく、PDFや「静止画」の方がよいという場面もあるはずだ。

RPubsというのがある。それとの違いはどこにあるだろうか。もちろん、RPubsがRスクリプトを使うということ以外に。
Screenshot-20230504-at-70308

RPubsの方は、私も試してみている。
yutaka031


|

April 21, 2023

市長選挙出口調査結果を対応分析で再分析

Screenshot-20230424-at-220317
北九州市長選挙出口調査の年代別得票率を対応分析によって再分析」というタイトルで「論文もどき」をnoteに書くことができた。自分で調査をおこなったわけではない。公表されている出口調査の結果を再分析したものである。出口調査の結果について以下のようなコメントを書いた。

1. 新市長となった武内和久候補が、60歳以上と30歳未満の年齢層で相対的にも絶対的にも得票率が低く不人気であったのはなぜなのだろうか。西日本新聞記事は、武内候補が「30~50代の働く世代の支持を集めた」という解釈をしているが、「働く世代」というとらえ方は的確だろうか。29歳以下でも、60歳以上でも多くの人が働いているわけであるから。落選した津森洋介候補が、30代の年齢層で相対的に得票率が低く不人気であったのはなぜだろうか。

2. 西日本新聞記事によると、「最も力をいれてほしい政策」としてあげられたものを年代別にみると、40・50代では「景気・経済対策」に期待する人の割合が、また、70・80代では「福祉・医療」に期待する人の割合が多かったという。しかし、どの程度の差が年代別にあったのだろうか。

3.「最も力をいれてほしい政策」を年代別に比較するだけでなく、この「期待する政策」と投票行動(どの候補に投票したか)との関連を同じようにグラフで示すことができたはずだ。また、「年齢」、「期待する政策」の2変数を同時に考慮して各候補への投票行動を分析したらどうだったのだろうか。そのような分析がなされれば、以下のような事柄を明らかにすることができたはずであり、候補者への支持に影響を与えた要因が、候補者のイメージ戦略との関連で明確になる可能性がある。

4. 武内和久候補の選挙活動での公約は、「100万都市の復活」と「稼げる街」というものであった。このそれぞれが有権者にどのように受け取られたかは、同候補の年代別得票率にどの程度の影響を与えただろうか。とくに、「福祉・医療」に期待する人の割合が多かったという「70・80代」は、主語が曖昧で意味も不明な「稼げる街」というキャッチフレーズをどう受けとめたのだろうか。このフレーズによって、もしも、例えば、高齢者が生活費の高騰を危惧することなどがあった場合、60歳以上の年齢層において同候補の得票率が低かったことがそのことで説明できる可能性があるだろう。

5. 当選した武内和久候補の場合、「追加公約」として「大胆な子育て支援、今すぐ少子化対策約12億円」というものがあった。この公約は有権者にどのように受け取られ、同候補の年代別得票率にどのように影響を与えたのだろうか。とくに、「教育・子育て」に期待する人の割合が多かったという「10~30代」に対してどの程度の影響を与えたのだろうか。

軸の解釈というのもやってみた。

補足3の「寄与率のグラフ」は、対応分析において各軸を解釈するためのものであるが、妥当な解釈をおこなうことは難しい。第1軸は、列ポイントのグラフから、当選可能性という要因と関係する認識や態度と解釈できるのではないだろうか。列ポイントのグラフで、2名の有力候補の列プロファイルが第1軸の形成に大いに寄与していることが示されていることからそのように考えられる。

有権者は、各候補者の当選可能性に対する予想に影響されずに投票する場合もあれば、そうではなく、当選可能性の高い候補者の中で選択を行う場合もある。第1軸は、この後者の場合の投票行動が反映されているのではないだろうか。

第2軸については、第1軸の解釈とは別次元のものを想像する必要がある。行ポイントのグラフも参照して考えると、当選可能性の認識に左右されずに候補者を選択するという投票行動の次元であろう。列ポイントのグラフでは、2名の有力候補以外の候補の列プロファイルが、また、行ポイントのグラフで、29歳以下の年齢層の行プロファイルが、第2軸の形成に大いに寄与していることからそのように考えられる。


|

April 15, 2023

覚え書き

固有値のことを主慣性と呼ぶ。

svは、特異値であり、それは固有値の平方根である。

主座標値は、標準座標値に特異値をかけて算出できる。

|

January 20, 2023

翻訳の誤り

『データサイエンスのための統計学入門』(オライリー・ジャパン)の翻訳の誤りについてnoteに書いてみた。
https://note.com/mbrmghm/n/nef474f0752bd

|