« April 2023 | Main | June 2023 »

May 30, 2023

北九州市、町内会、二次的データ、R言語、その他。

「晩年の作法」という言葉があるのかないのかわからない。しかし、歳を取ると制約が少なくなり自由になる面があるが、体力の衰えや収入の減少などがあるので、何をどうやるかをよく考えなければならないことは事実だ。

最近、北九州市の動向に関心を持っている。これは、調べやすいテーマなので続けていこうと思う。市内であっても、市議会の傍聴などに出かけていくのは面倒なので、新聞2紙に目を通して、新聞記者が捉えた北九州市の動向を把握し、疑問に思うことなどを自分で調べてみようと思う。これが、「北九州市の研究」。

次に、自治体よりももっと草の根レベルの「町内会・自治会」について、周りの人に迷惑がかからないように多少は注意しながら調べて考えてみる。2021年度に町内会の会計をやったので、それで知り得た情報がとても貴重なものだと思っている。最近、「ホテルの部屋数で、町内会費が高くなる?!」という西日本新聞記事を目にして、それに読者としてコメントを書いてみた。色々な意見が私以外にも寄せられていておもしろい。「あな特調査依頼」という欄である。「床屋談義」の場所にもなるのではないだろうか。

次に、「Rによる二次的データの分析」。公表されている様々なデータを分析していく。おそらく、北九州市や福岡県についての統計的データを中心に取りあげていくだろう。RStudioで作成したHTMLファイルは、その一部をRPubsで公開している。

あとは、「情報社会論」、「健康と病気」など。これらは、「北九州市の研究」と結びつけ、統計的データを中心にして調べていけば効率的であろうと考えている。

いつまで続くかはわからない。「成果」は、ココログではなくnote.comの方で公表していく予定である。


|

「たけうち和久」氏の「宇宙ビジネスの未来」という記事を見つけた。

おはようございます。38℃近い暑さの中でも、動き廻っている武内(「たけうち」と表記するのは選挙用か?:引用者)和久です。

宇宙×ビジネスの領域では日本随一の知見を持つ青木英剛さんが北九州を来訪してくれました。
未来に思いを馳せた議論に花が咲きました。

前日に九経連で講演し、「九州を宇宙首都に!」と訴えて来られた青木氏。
実際に大分県を「宇宙県」へと進めてきた立役者でもあります。
大分空港は「宇宙港」となり、青木さんは欧米の宇宙企業を大分県に誘致する支援をしました。
2020年代には20発のロケットが打ちあがる見込みだそうです。


(途中省略)
今は、人工衛星から得られるデータで、社会課題を解決するのが重要な使命です。
例えば、災害の状況、渋滞のモニター、教育(なぜ教育がこのリストに出てくるのか不明:引用者)など、多くのデータを得ることができます。

(途中省略)
「宇宙」産業は、日本のものづくり、地場経済を支える可能性を秘めているだけでなく、日本という国自体の国防上の重要性(防衛産業ということになると軍事機密保護等の理由で、地元の小学生や市民の工場見学などは拒否だろうか:引用者)も秘めています。必ず必要となる産業です。
時代の波を先読みできるか、そこに乗れるか、そこが勝負ですね。

ここで引用した「宇宙ビジネスの未来」は、「北九州未来会議」の「たけうち和久」氏がnoteに2022年8月4日 に書いたもの。

まず指摘しておきたいのは、武内和久氏の「人工衛星から得られるデータで、社会課題を解決する」という考え方は、「都市生活を完全に技術的な視点で見ることは、表面上はスマートに見えるが、実際には不正義と不平等に満ちた都市をもたらす」としてBen Greenが批判している考え方そのもののようであることだ。

もし、都市を自動運転車だけが解決できる交通最適化の問題と考えるなら、都市は歩いて暮らせる密度の高い地域を育てるべきだという新たなコンセンサスは崩れ、代わりに自動運転車のために都市をデザインするというこれまでに無いパラダイムを迎えることになる。(『スマート・イナフ・シティ』p.63 )
In The Smart Enough City, Ben Green warns against seeing the city only through the lens of technology; taking an exclusively technical view of urban life will lead to cities that appear smart but under the surface are rife with injustice and inequality. ( The Smart Enough City )


予算案の説明で「宇宙ビジネス」に期待をかける発言が見られたのはこの記事で紹介されている青木氏の影響なのだろうか。 「時代の波を先読みできるか、そこに乗れるか、そこが勝負」という言葉が印象的であるが、失礼な言い方をあえてすれば、軽薄に聞こえる。ビジネスがうまくいかなければ倒産という選択肢があるビジネスマン、会社経営者としてはそういう発想でもいいが、地域住民の生活に責任を持つべき地方自治体の市長としてはどうなのだろうかと思う。「リスクをとってチャレンジ」という「ブルーミンジャパン」のキャッチフレーズは任期の4年間忘れた方がよい。

人工衛星を打ち上げる「宇宙港」とかいうものが北九州市やその隣接地域に必要だろうか。(ココログの記事)

「宇宙ビジネス」の注目領域は?--宇宙エバンジェリスト・青木氏に聞く新規参入のヒント(japan.cnet.comの記事)

日本国内においても、北海道大樹町、和歌山県串本町、大分県国東市、沖縄県下地島の4箇所で、民間企業もしくは自治体主導で宇宙港のプロジェクトが動き始めているとのこと。米国では地方空港が宇宙港を兼ねる動きもあることから、国内でも似た動きがさらに出ると予想され、2030年代には計10箇所ほどになる可能性もある。(上記japan.cnet.com記事より引用)
Img_1773
北九州空港でスターフライヤー機に乗ったときの写真。 国東半島が地図に見える。

|

May 27, 2023

noteのマガジン

Screenshot-20230527-at-192847

現在の本数は次の通り。 Rによる二次的データの分析、51本。 情報社会論、9本。 町内会の研究、10本。 北九州市の研究、34本。 健康と病気、12本。 仕事部屋、28本。

|

「人口100万都市の復活」という公約が市民生活にどのような影響を与えるか。

Twitterでは書き足りないところがあったので、ココログで続きを書く。Twitterで取りあげたのは西日本新聞の次の記事。

バックアップ首都、宇宙産業…北九州市の成長へ“種まき” 武内流予算、問われる実行力

「補助金の一部廃止や事業見直しで約2億円を捻出した」ということだが、無意味な補助金や執行されるべきでない事業を外すことができたのなら評価すべきだ。その点はどうか。

西日本新聞記事が触れている「種まき」のために「捻出」された約2億円が、どういう分野からどういう方法で捻出されたのかに注目したいと思っている。「人口100万都市の復活」という公約を実現しようとすることが北九州市の市民の生活にどのように影響するのかを見ていきたい

朝日新聞記事では、「北九州市は25日、総額6092億円の2023年度一般会計当初予算案を発表した。武内和久市長にとって初の本格予算編成となり、前年度比9億円(0・2%)の増額。新型コロナウイルス対策で過去最大だった21年度に次ぐ規模となった。6月1日に開会する市議会に提出する」と初めに説明があり、捻出の方法等については、以下のように書かれている。

 新型コロナ対策のための予備費をなくしたことや、市職員の定年引き上げに伴う人件費減、事業手法の見直しなどで財源確保に努め、財源調整用基金の取り崩しは118億円(前年度比29億円減)にとどめた、とする。ただ、基金の残高は今年度末には262億円、27年度末には138億円にまで減る見通し。(朝日新聞記事)

「事業手法の見直し」がどういうことなのか知りたい。それ以外は「捻出」したと評価できるものではない。新型コロナ対策のための予備費をなくしたことは、武内和久新市長が唱える「官民連携による行財政改革」とやらとは無関係だし、定年の引き上げも、退職金の支払い時期がずれるだけであり、同様である。

Screenshot-20230528-at-165849

(地方公務員法の一部を改正する法律について)

|

May 26, 2023

久しぶりにココログのデザインを変更した。

Screenshot-20230526-at-194900

「記事表示列」を「可変」に変更した。記事の部分の横幅がウィンドウの幅次第で変化するようになった。見やすいように、表示される文字のサイズも変更し少し大きくした。note.comと比べて、デザインに自由度があることは評価できる。記事の横幅を変えたり、文字のサイズや色を変えたりすることで「自分のサイト」という感覚を持つことが可能だ。

私は、基本的にはミニマリストのデザインを好む。いろいろと試行錯誤をしてみて、自分のココログの表示が満足できるものになった。(最近、LaCoocanのトップページもHTMLファイルを編集して体裁を変えた。)

ところで、「記事を書く」にログインする前の、ココログのページは何とかならないだろうか。 次の2つの大きな画像が交代で出てくる。こういう大げさな紙芝居は、「蓼食う虫も好き好き」なのかもしれないが、洗練されたデザインとはいえない。

Screenshot-20230526-at-203654

Screenshot-20230526-at-203703

|

May 25, 2023

@niftyさん、改善して下さい。ココログ・プロのユーザーです。

Screenshot-20230525-at-155635

「記事を書く」ために、ココログのウェブサイトにログインすると、右下に、これから何かを書こうとする人にとっては余計な情報が出てくる。首相官邸での岸田一族(?)のバカ騒ぎのこと、歌舞伎役者の自殺幇助のことなど。

書きたいことがあってログインするわけだから、ニュースの紹介などはめざわり。「注目のニュース」というタイトルはどういう意味か。「注目されている」という意味か、それとも、「注目しなさい」という意味か。どちらの場合でも、そこにそれはいらない。

最近使い始めたnote.comではこういうことない。以下のように、「クリエーター」の気を散らすような情報は表示されていない。

Screenshot-20230525-at-160334

|

May 23, 2023

ナッジに気をつけよう。補助金と罰金だけではない。

Tempimagenlpcjp

ハヤカワ文庫の『行動経済学』(ミシェエル・バデリー著、土方奈美訳)がなかなかおもしろい。「朝三暮四」という表現は出てこないが、そんなような例がたくさん出てくる。「何とかバイアス」というのがいくつも出てくる。

実験の例もいろいろと出ていて、「人びとが純粋な利他心からではなく、他の人びとに自分が善良で気前よい人間だとシグナリングするために利他的行為を行うことが示されている」というような説明があり、それはそうかもしれないが、そういうことに着目して募金活動などが行われるのだろうかと思うと複雑な気持ちになる。アービング・ゴフマンの「インプレッション・マネージメント」と共通するとらえ方なのかもしれないが。

要するに、人間の行動は合理的とは言えず、損をしてでも無理に自分をよく見せようとしたり、現実を正確に把握することができず簡単なトリックに引っかかって操作されてしまうという発想のようだ。

マイナンバーカードの導入のために、取得すれば5000円分のポイントを付与するとか、健康保険証としての利用申し込みで7500円分のポイントを付与するとかいうやり方を政府が採用した。政府は、そのために予算を組み税金をたくさん使った。マイナンバーカードを取得させるためのインセンティブになるようにしたわけだが、これは、行動科学の「知見」を適用したものなのだろうか。導入のためにはそうするしかないと考えたのだろうか。


Continue reading "ナッジに気をつけよう。補助金と罰金だけではない。"

|

May 22, 2023

RPubsというサイト

Screenshot-20230522-at-151218

RPubsというサイトは、便利だ。RStudioからpublishやrepublishができる。
ここにアップロードしたファイルは、Googleの検索にも引っかかりやすいようだ。「調査データの整理」を検索するとRPubsが3番目に出てくる。

Screenshot-20230522-at-151735

「調査データの整理」は、「『平成17年社会調査実習報告書』の思い出」という記事をnoteで書いたときに使ったRマークダウンファイルを実行したものである。

|

May 21, 2023

ハイテクバナナ共和国

Tempimagewly3hu

最近買った本を最後のページから数ページ読んでみた。つまり、最後のページの最後のパラグラフから前へ前へと読んでいった。結論をまず確認しようとした。

「ハイテクバナナ共和国(high-tech banana republics)」ということばが印象に残った。

次のような表現もあった。

a future of gated communities and mobs led by demagougues at their gates

扇動政治家はゲートの外に暴徒とともにやってきて、中の人びとを威嚇するのであろう。いつもは、別の街でゲートの中に住んでいるはずだが。

Michael LInd, The New Class War: Saving Democracy From the Managerial Elite, Portfolio/Penguin, 2020.

The new class war: did a liberal elite pave the way for rise of Trump?

|

May 20, 2023

人工衛星を打ち上げる「宇宙港」とかいうものが北九州市やその隣接地域に必要だろうか。

市は北九州空港(北九州市、福岡県苅田町)を人工衛星の打ち上げ拠点「宇宙港」として整備し、宇宙産業の集積を図る構想を打ち出す。関連経費2400万円を当初予算案に盛り込む。
北九州市、「バックアップ首都」へ政府機能誘致へ 当初予算案、宇宙港構想も(西日本新聞記事)

誰がこういうことを考えているのだろうか。税金の無駄遣いになるのではないか。2400万円で実施できる他の事業はないのだろうか。
「宇宙港」とかいうのは大都市のそばにつくるべきものだろうか。ちなみに、同種の計画が先行している大分県国東市の人口は、約2万6千人。

政府機能については、デジタル庁の関連施設などを想定。武内和久市長は厚生労働省職員時代に首都機能移転のプロジェクトチームに在籍しており、人脈を生かしたい考えだ。(同上記事)

「人脈」を生かすという発想もどうなのだろうか。常識的には「公人」は、こういうことは大げさに言わないでやるはずだから、選挙の時のように、市民へのアピールのつもりなのだろう。そもそも、官僚出身の人物が、国の政策を「人脈」でなんとかできると公言しているというところに問題がある。


Sa270069_2
この写真は、2005年11月5日に撮影したもの。


Continue reading "人工衛星を打ち上げる「宇宙港」とかいうものが北九州市やその隣接地域に必要だろうか。"

|

May 18, 2023

moteki.netについて

Screenshot-20230519-at-103848

個人ウェブサイトを久しぶりに作成した。ドメイン名「moteki.net」を使用。「研究もどき」を続けていく場所とする予定。久しぶりにHTMLとCSSに関する本やサイトを参考にしてウェブサイトを作成した。CSSの方は分からないことが多い。

|

May 17, 2023

noteで公表したもののPDFファイル

今年の1月頃からnoteの「マガジン」という形式で取り組んだことの成果。データ処理の作業は基本的にRStudioでおこなった——あるものは、その過程を示すためにRPubsに公開している。

「研究もどき」を19本も短期間に書くことができて達成感がある。しかし、振り返ってみると、何か結果を出したいというよりも、机に向かって時間をつぶしたいという目的が影響しているようだ。それで、次に何に取り組むべきなのかと今考えている。これまでの続きをやっていけばいいのだろうと思う。

  1. 世論調査における政党支持と世帯年収との関係について(1)
  2. 世論調査における政党支持と世帯年収との関係について(2)
  3. 「防衛力強化を支持する世論」は、どのような方法で 「防衛力」を強化できるかについての情報を政府やメディアから十分に与えられているだろうか。
  4. 北九州市長選挙出口調査の年代別得票率を対応分析 によって再分析
  5. 北九州市長選挙(2023年2月5日)
  6. 北九州市の市長選挙は何だったのだろうか。
  7. 北九州市長選(2月5日)出口調査
  8. 候補者の演説の分析
  9. オッズ比と相対リスクの使い分けについて
  10. 自転車用ヘルメットの着用は死亡事故を減らせるか?
  11. 「教師なし学習」と予測、主成分分析
  12. 『データサイエンスのための統計学入門』(オライリ ー・ジャパン)の翻訳の誤り
  13. 『データサイエンスのための統計学入門』と「say」
  14. QQプロット
  15. カイ2乗検定(chi-square test)
  16. 正常な偶然変動の範囲とは
  17. 統計的機械学習
  18. 統計量の標本分布
  19. 誤訳・悪訳の病理

|

May 16, 2023

データサイエンスのための統計学入門(PDFファイル)

これは、Practical Statistics for Data Scientists, 2nd Editionという本の訳書を読んでいて気づいたことをnote.comでメモしたものである。

訳書では、データサイエンティストが、データサイエンスに、実用統計学が、統計学入門となっている。実用ということは入門とは違うと思う。入門レベルのことだけでは実用にならないはずだ。

  1. 「教師なし学習」と予測、主成分分析
  2. 『データサイエンスのための統計学入門』(オライリ ー・ジャパン)の翻訳の誤り
  3. 『データサイエンスのための統計学入門』と「say」
  4. QQプロット
  5. カイ2乗検定(chi-square test)
  6. 正常な偶然変動の範囲とは
  7. 統計的機械学習
  8. 統計量の標本分布
  9. 誤訳・悪訳の病理
Screenshot-20230516-at-100931

|

May 14, 2023

オッズ比、相対リスク、自転車用ヘルメット(PDFファイル)

去年(2022年)の1月に電動アシスト自転車を買って、雨の日以外は毎日それで外出している。ヘルメット着用の「努力義務」とかが実施される前から、私の場合、自転車用ヘルメットを着用していた。 ヘルメット着用を義務づければ事故での致死者が減るかどうかははっきりしない。

  1. オッズ比と相対リスクの使い分けについて
  2. 自転車用ヘルメットの着用は死亡事故を減らせるか?
Screenshot-20230515-at-113155

|

北九州市長選挙(PDFファイル)

2023年3月5日に行われた北九州市長選について分析した。
  1. 北九州市長選挙出口調査の年代別得票率を対応分析 によって再分析
  2. 北九州市長選挙(2023年2月5日)
  3. 北九州市の市長選挙は何だったのだろうか。
  4. 北九州市長選(2月5日)出口調査
  5. 候補者の演説の分析
Red_20230515075601

|

世論調査について(PDFファイル)

  1. 世論調査における政党支持と世帯年収との関係について(1)
  2. 世論調査における政党支持と世帯年収との関係について(2)
  3. 「防衛力強化を支持する世論」は、どのような方法で 「防衛力」を強化できるかについての情報を政府やメディアから十分に与えられているだろうか。
Red_20230515075601

|

May 13, 2023

利用しないまま放置していたサイトのトップページを編集した。

Screenshot-20230514-at-72213
2014年4月以来9年間利用しないまま放置していたサイトのトップページをようやく削除し、サイトマップであったものを手なおしてそれに代えた。

社会学とその方法のオンライン研究室

最近はnote.comをよく使うが、PDFファイルなどを置く場所としては普通のウェブサイトが便利であろうから、このサイトは削除しないで維持していこうと思っている。1998年に開設したもの。このブログは2003年末であるから、これよりも古い。

|

May 11, 2023

イメージ戦略、争点形成、アッパーミドル層、普遍主義

Tempimage4x9sqp
昨日近所の本屋で雑誌『世界』(岩波書店)6月号を買ってきて、まず、2つの記事を読んだ。
松本創「維新体制『完勝』の現実とその戦略」
吉弘憲介「検証・大阪維新の会の財政運営:普遍主義に潜む社会的分断」

興味深い内容であった。

松本創氏の文章に「候補者は服装や髪形に気を配り、演説口調から笑顔の作り方まで練習する」というのがあり、イメージ戦略と「コンサルティング会社」との関係などを調べてみたい気になっている私には納得できた。松本氏が取りあげたテーマとは少しずれるが、私は、各レベルの選挙にコンサルや広告代理店はどの程度関与しているのかということに関心を持っている。選挙ポスターだけでなく、もしかしたら政策のキャッチフレーズの作成も請け負っているのだろうか。お金を出せば出すほど宣伝戦略において有能な人を雇うことができるのかもしれない。

吉弘憲介氏は、「教育を通じて世代の再生産を企画する」のが米国の「アッパーミドル層」だと説明している。また、関連する注で、「年齢が比較的若く、所得水準が高いグループ」に言及している。大阪市内の「アッパーミドル層」は、日本版gated communityの「タワマン」に住むことを夢見る人たちだろうか。また、子の教育への関心は、日本の場合、「中間層」だけに限られたことであっただろうか。

維新の動向は私も感心を持っていることであり、数日前にnoteで以下のように書いた。

(以下引用)

「維新、野党第1党へ本腰…次期衆院選は立民と選挙協力決別か『より多くの候補者出す』」という記事が2023年4月27日付けで読売新聞オンラインに掲載されている。「立憲民主党」と「日本維新の会」との「棲み分け」がうまくいきにくいことの背景には、ここまでの分析で確認されたような政党支持と所得階層との関連性があると考えられる。

所得階層の関連で捉えれば、両党のプロファイルは、かけ離れており、両党の支持者が政治に期待する内容にずれがあるはずである。したがって、たとえ有権者への呼びかけが選挙協力についてなされても、両党の支持者の投票行動に大きく影響を及ぼすことがあるとは想定しにくい。(公明と自民の場合には、明らかに、別の要因があって協力がなされているのであろう。)

世論調査における政党支持と回答者の世帯年収との関係について(その1)

|

May 07, 2023

退職老人の研究方法

Screenshot-20230507-at-120317

高性能の物差しを使う。ウェブサイトからダウンロードした新聞記事のグラフに物差しを当てる。実を言うと、この「直定規」は、近所の百円ショップで4月27日に買ったもの。工夫されていてなかなかよい。

様々な形で公表されているデータの二次的分析をおこなうという方針でやっている。だから研究費もいらない。

Screenshot-20230507-at-121517

それに、R言語のスクリプト、RStudio、Rマークダウンファイルなどを使う。SPSS、SASなどは使わない、というよりも使える環境にない。

Screenshot-20230507-at-122544

これが昨日の作業の成果。世論調査における政党支持と回答者の世帯年収との関係について(その1)

学会誌も紀要も関係ない。note.comに載せればよい。

|

May 04, 2023

PDFには確かに不便なところがあるが、その不便なところに長所も含まれている。

PDFs are bad for data visualization and storytelling – but what’s the alternative?

The easiest solution is your website. Publishing a digital report as an HTML page allows you to create stunning content that’s easy to share and analyze. Web pages are the best audience-centric choice thanks to their cross-device optimization, interactive possibilities and shareable nature. Besides, with the plethora of third-party tools widely available, it is now possible to create digital content without any coding involved.

With Flourish, you can create beautiful interactive stories that could be embedded into your webpage in a matter of seconds. Whether you work on annual reports or present industry findings, inspiration is everywhere!

最近インターネット上で「A Flourish chart」という文字がグラフの右下に出てくる記事があって関心を持った。便利なツールのように思うが、使ってみるべきかどうかを検討することにしたい。おそらく、PDFや「静止画」の方がよいという場面もあるはずだ。

RPubsというのがある。それとの違いはどこにあるだろうか。もちろん、RPubsがRスクリプトを使うということ以外に。
Screenshot-20230504-at-70308

RPubsの方は、私も試してみている。
yutaka031


|

May 03, 2023

1つのファイル

noteで最近作成したファイル4つを、きのう印刷して1つのファイル(ring note)でまとめてみた。
書評らしきもの、論文もどき、時評らしきものから成り立っている。最初のもののアップロードは、3月1日、最後のものは4月29日である。
誰からも頼まれているわけではないのだが、2ヶ月間、運良く時間的な余裕があり不思議なくらい熱中することができた。Tempimagesixpaf
Screenshot-20230503-at-114937

対応分析では、藤本一男氏の『対応分析入門:原理から応用まで』(オーム社、原著はSten-Erik Clousen)がたいへんに参考になった。実際の計算やグラフ作成では、RStudioを利用した。

|

ChatGPTが生成した文章には、著作権法や商標法に違反する可能性がある表現が含まれる場合がある。

Screenshot-20230325-at-114031_20230515080001
「ChatGPTが生成した文章には、著作権法や商標法に違反する可能性がある表現が含まれる場合があります。」ということはどういうことですか。


以下はChatGPTの回答:

「ChatGPTが生成した文章には、著作権法や商標法に違反する可能性がある表現が含まれる場合があります。」という文言は、ChatGPTが生成した文章には、知的財産権に関する法律に違反する表現が含まれる可能性があるということを意味しています。

たとえば、ChatGPTが生成した文章には、他人の著作物を不当に引用している場合や、商標権を侵害している場合があります。これらの表現が含まれる場合、それらは違法行為にあたる可能性があるため、注意が必要です。

ChatGPTは、大量のデータから学習された自然言語処理のモデルであり、その生成結果は、時には予期せぬ表現を含むことがあります。そのため、生成された文章を利用する場合は、著作権や商標法に違反する可能性があるかどうかを注意深く検討することが重要です。

User
著作権や商標法に違反する可能性があるかどうかを注意深く検討するためにはどうしたらいいですか。

ChatGPT
著作権や商標法に違反する可能性があるかどうかを注意深く検討するためには、以下のような方法があります。

著作権や商標法に関する基礎知識を身につける:著作権や商標法に関する基本的な知識を学ぶことで、違反のリスクを減らすことができます。これらの知識は、インターネット上の情報や専門書籍などから入手できます。

引用・パロディなどの例外規定について理解する:引用やパロディ、批評・評論など、著作権法には例外規定が存在します。これらの規定を理解することで、違反のリスクを減らすことができます。

インターネット上の素材には著作権があることを認識する:インターネット上の画像や音楽、文章には、著作権があることを認識することが重要です。自由に使用できる素材もありますが、著作権者の許可を得ないで使用することは違法行為になる場合があります。

商標権の登録状況を調べる:商標権を侵害する可能性がある場合には、その商標が登録されているかどうかを確認することが重要です。登録された商標には、特定の使用方法に関する制限が設けられている場合があります。

弁護士に相談する:特に、商標権や著作権に関する問題が複雑な場合には、弁護士に相談することをおすすめします。専門家のアドバイスを受けることで、法的リスクを最小限に抑えることができます。

これらの方法を活用することで、著作権や商標法に違反する可能性があるかどうかをより正確に判断することができます。

|

ChatGPTとのやりとり(著作権等について)

Screenshot-20230325-at-114031_20230515080001
「ChatGPTのトレーニングデータは誰が選択していますか。」と質問した。

ChatGPT
ChatGPTのトレーニングデータは、OpenAIによって選択されたデータセットから生成されています。具体的には、Wikipediaやニュース記事、書籍、Webページなどの大量のテキストデータが使用されています。これらのデータは、インターネット上から収集されたものであり、OpenAIは、これらのデータを選択してトレーニングデータとして使用することについて、特に誰かによって指示されたわけではありません。ただし、OpenAIは、トレーニングデータに選択されるデータが公正かつ多様であることを確保するために、さまざまな方法を使用して、データの品質を監視しています。


User
Wikipediaのテキストデータは、許可を得て使っていますか。

ChatGPT
はい、Wikipediaのテキストデータは、Creative Commons Attribution-ShareAlike License(CC-BY-SA)の下で公開されており、自由に使用することができます。このライセンスは、情報の共有と再利用を促進するために設計されています。したがって、OpenAIは、Wikipediaからデータを収集し、ChatGPTのトレーニングに使用することができます。ただし、OpenAIは、Wikipediaに掲載されている情報を尊重し、情報の正確性や機密性を保護するために最大限の注意を払っています。


User
自由に使用するが、Wikipediaに貢献したり、出所として示したりはしないのですね。

ChatGPT
そうです、Wikipediaのテキストデータは、Creative Commons Attribution-ShareAlike License(CC-BY-SA)の下で公開されており、自由に使用することができます。ただし、このライセンスにはいくつかの条件があり、その1つは、使用した情報に対して、適切な出典を示すことです。また、Wikipediaに貢献した場合、その貢献に対してクレジットを与えられることもあります。ただし、ChatGPTによる応答や出力には、Wikipediaの情報源を明示する必要はありません。しかし、OpenAIは、情報の正確性を保証するために、多様な情報源からトレーニングデータを収集し、情報の出所に注意を払っています。


User
なぜ情報源を明示する必要はないと考えるのですか。

ChatGPT
ChatGPTが生成する応答や出力は、機械学習モデルが学習した知識と推論に基づいて生成されます。したがって、ChatGPTが生成する情報は、トレーニングデータの情報源から派生していると言えますが、その出所を明示する必要はありません。これは、ChatGPTが生成する応答があくまで機械学習に基づいた自動応答であり、その出所が重要であるとは限らないからです。ただし、OpenAIは、ChatGPTが生成する情報が信頼性の高い情報源から派生していることを保証するために、トレーニングデータの品質に最大限の注意を払っています。


User
「出所を明示する必要はありません」ということの根拠はどこにありますか。

ChatGPT
すみません、誤解を招くような回答をしてしまいました。正確には、ChatGPTが生成する情報がトレーニングデータから派生していることは事実ですが、情報源を明示する必要がある場合があります。特に、生成された情報が引用、参照、あるいは知識を提供する目的で使用される場合、その出所を明示することは重要です。また、出所を明示することによって、情報の正確性や信頼性を評価することができます。ですので、ChatGPTが生成する情報が公的な議論や論文などで利用される場合は、情報源を明示することが望ましいです。OpenAIも、ChatGPTが生成する情報が信頼性の高い情報源から派生していることを保証するために、トレーニングデータの品質に最大限の注意を払っています。


User
ChatGPT自身は、情報源を明示することはないのですか。

ChatGPT
はい、ChatGPT自身は情報源を明示することはありません。ChatGPTは、トレーニングデータから学習した知識を元に応答を生成しますが、その知識がどこから得られたかをモデル自体が認識しているわけではありません。したがって、ChatGPT自身が情報源を明示することはできません。ただし、ChatGPTが生成する応答や出力が、トレーニングデータの情報源から派生していることは事実であり、必要に応じて情報源を明示することが望ましい場合があります。


User
「ChatGPTが生成する応答や出力が、トレーニングデータの情報源から派生していることは事実であり、必要に応じて情報源を明示することが望ましい場合があります」ということは、どういう形で解決されていますか。

ChatGPT
ChatGPTが生成する応答や出力が、トレーニングデータの情報源から派生していることを示すために、OpenAIは以下のような手段をとっています。

まず、OpenAIはChatGPTを公開する際に、トレーニングデータの一部を公開しています。これにより、ChatGPTが学習した知識がどのようなものかを確認することができます。

さらに、OpenAIはChatGPTを公開する際に、生成された応答がトレーニングデータから派生していることを示す声明を出しています。この声明には、ChatGPTがトレーニングデータから学習したことを前提にしていること、また、生成された応答が100%正確であるわけではないことが明記されています。

加えて、OpenAIはChatGPTを公開する際に、応答生成の過程で使用されたアルゴリズムについても公開しています。これにより、ChatGPTがどのようなアルゴリズムで応答を生成しているかを確認することができます。

したがって、OpenAIはChatGPTが生成する応答や出力が、トレーニングデータの情報源から派生していることを明示することで、ユーザーがChatGPTがどのような知識から応答を生成しているかを理解することを支援しています。


User
オープンソースのデータを利用するが、著作権者等については個別には明らかにしないということですか。

ChatGPT
OpenAIは、オープンソースのデータを利用していますが、著作権者や出典については明らかにしていません。これは、オープンソースのライセンスが許容する範囲内での利用であり、出典や著作権者の明示が必要な場合にはその義務を果たしていると考えているためです。

ただし、OpenAIはChatGPTのトレーニングデータの一部を公開しており、その中には出典や著作権者について明示されているものもあります。また、OpenAIはトレーニングデータの使用にあたっては、著作権や法的な問題に配慮することを努めています。

一方で、個人がオープンソースのデータを利用する場合には、出典や著作権者の明示が必要な場合があります。例えば、オープンソースのライセンスがそれを求めている場合や、著作権者が明示を求めている場合などがあります。個人が利用する場合には、オープンソースのライセンスや著作権者の要望に従うことが望ましいです。

Continue reading "ChatGPTとのやりとり(著作権等について)"

|

May 01, 2023

Google検索とChatGPTの違い

Screenshot-20230325-at-114031_20230515080001
ChatGPTは、色々なスタイルの質問に答えを出してくれる。
話し相手にもなってくれる。
しかし、間違っている情報を堂々と「論理的に」まとめたりする。
頑固に自説を主張することもある。
知ったかぶりをしているように感じられる。
向こう側に人がいるようで気味が悪いときがある。
「Big Brother is watching you」という感じもする。

Google検索の方は、調べたいことが明確であれば、いろいろな結果を示してくれる。
情報の出所も明確なので、自分でその信頼性を確認することができる。
なれなれしくしてくることもない。
極めて機械的な対応である。
検索用語を渡しているだけなので、検索の意図などは説明しなくていい。

[補足]
ChatGPTは、私たちに回答を示すだけでなく、私たちが入力したものから「学習」しているということに注目すべきであろう。「情報漏洩」に気をつけなければならない。

|

「防衛力」とは何か。

「防衛力強化を支持する世論」は、どのような方法で「防衛力」を強化できるかについての情報を政府やメディアから十分に与えられているだろうか。という文を2日前にnoteに書いた。

この問題について専門家というわけではない。しかし、書くために多少は調べたり考えたりするので、自分の考えをまとめるためにはnoteに書くことはいいことだと思っている。

|

« April 2023 | Main | June 2023 »