タイタニック 号 生存 者。 タイタニック号の海難事故で1500人が亡くなり700人が助かりましたが ...

タイタニック号の乗客の生存予測~Kaggleに挑戦(その1) │ キヨシの命題

タイタニック 号 生存 者

1912年4月14日は あの タイタニック号が沈没した日です。 当時世界最大の豪華客船として 華々しく登場したにも関わらず その処女航海で沈没。 多数の死者を出し 「あの時氷河にぶつからなければ... 」と 悔やまれる事故でしたよね。 映画「タイタニック」を観てからは そんな気持ちがますます高まってしまいましたが^^; まあ ジャックとローズは架空の人物なので あの事故であんなロマンスがあったかどうかは不明ですが タイタニック号の事故は、100年以上たった今でも 多くの人の興味と関心を引いていますよね。 ところで タイタニック号に日本人が乗っていたというのは 真実の話なのでしょうか? そして あの事故から無事生存者として帰還した という話にもびっくりですよね。 なぜタイタニック号に乗って どうやって生還したのでしょうか。 気になったので調べてみました~。 タイタニック号に乗っていた日本人て誰? 1912年4月10日、タイタニック号は イギリスのサウスハンプトン港を出発。 タイタニック号には ジョイン乗客合わせて2,200名以上が乗っていましたが その中に 一人の日本人の姿がありました。 その日本人の名前は 細野正文さん。 細野さんは、 鉄道院副参事で 第1回鉄道院在外研究員としてロシアに滞在し イギリスにいる知人を訪ねてから ニューヨーク経由で帰国する途中でした。 留学を終えて帰国するときに 知り合いの住むイギリスから ちょうど世界最大級の豪華客船 タイタニック号が出る。 細野さんがタイタニック号に乗船したのは 本当に偶然が重なったんですね~。 そして 悲劇の事故に巻き込まれていくわけですが その事故に遭遇するとは これも偶然が重なりましたよね。 タイタニック号には 実際に日本人が乗っていたということがわかりました。 ですが 乗員乗客合わせて1,513人という犠牲者を出し しかも、婦人や子供を再優先、というルールがあったにもかかわらず なぜ細野さんは救命ボートに乗って 一命を取り留めることができたのでしょうか。 細野正文さんが生き残こることができたのは? 細野さんがなぜ無事に生還できたのか これについてはずっと謎に包まれていました。 なぜ生き残れたか、というよりも なぜ生きて帰ってきたのか、という 批判の方が大きかったのです。 しかも、ある白人男性が 「人を押しのけてボートに乗り込んだ」男性が細野さん という証言が出たため、 新聞を中心に、大ブーイングが吹き荒れたといいます。 細野さんはその批判について 一切反論しないまま、68年の生涯を終えました。 ようやく 詳細がわかったのは 細野さんが亡くなってから。 細野さんの遺品から 事故が起きてから 4月18日にニューヨークに着くまでのことについて 記録した手帳が見つかったんですね。 その手記によると 事故が起きて、もう助かる道はない、と 船と一緒に沈む覚悟を決めた細野さんでしたが 「救命ボートに2名空きがある!」という声を聞き さらに一人の男性がボートに飛び降りるのを見て これはチャンスだと思い 銃で打たれる覚悟で飛び降りたそうです。 そのボートというのが、10号ボートで 例の白人男性の証言では、13号ボートだったので (ここには中国人男性が乗っていた) 細野さんではない、ということが明らかになりました。 細野さんの汚名が晴れて、よかったですね! でも あの時ボートに空きが出なければ 細野さんがボートと沈む覚悟のままいたら... と考えると 本当に人の人生ってわからないですよね。 細野さんは一命を取り留めた後帰国し 子供が生まれました。 そして孫ができますが その孫はY. のメンバーで、ミュージシャンとして 広く活動をしている、 細野晴臣さんです。 細野さんがいなければ 数々の名曲も生まれなかった... 細野さんはやっぱりあの時 生きる運命にあったんだなあ、という気がしてなりません。 タイタニック号沈没事件を題材に ロマンティックな映画が生まれたりもしましたが やっぱりこういう大きな事故は 2度と起きてほしくないですよね。 スポンサードリンク.

次の

「タイタニック」映画が見せなかった15の真実

タイタニック 号 生存 者

视频播放位置 恥知らずと罵られた半生 豪華客船タイタニック号の沈没後、ある英国人乗客が手記にこう記していた。 「一人の日本人男性が乱暴に他人を押しのけ、無理やり救命艇に乗った。 」 タイタニック号に乗り合わせていた唯一の日本人乗客である細野正文氏は、当時運よく救命艇に乗り込み命拾いしたものの、生涯「卑怯な生存者」という汚名を背負い続けた人物だ。 細野氏は1870年生まれで、1912年当時日本鉄道院の主事を務めていた。 露、英での研修を終え、英国から北米へと向かうタイタニック号に乗り合わせていた。 翌15日1時40分、最後の救命艇が海に降ろされる。 このとき細野氏は船員に撃ち落とされる危険を顧みずに女性と子どもでいっぱいの救命艇に女装でよじ登ったという。 本来助かるべき女性一人を差し置いて自分が乗り込んだという説もある。 こうして細野氏は力の弱い女性と子どもに混じって命拾いをした卑怯な男だと罵られることになった。 細野氏は帰国後、高官職を免官され、平の鉄道事務員に降格。 後に岩倉鉄道学校に転勤した。 1939年に世間の冷たい視線を浴びる中で他界する。 しかし、1941年にタイタニック号沈没事故にまつわる細野氏の手記が発見される。 細野氏は世間から批判されるような行動を取っていなかったことが発覚し、氏の孫が祖父の名誉回復に向けた取り組みを始める。 事故当時、細野氏が乗ったのは10号救命艇で、無理やり乗り込んできたと指摘した英国乗客の救命艇は13号であった。 実は当時10号救命艇には二人分の空きがあり、上艇の順番を待っていた三等客室の乗客とともにその場にいた二等客室乗客の細野氏には優先上艇権があったのだ。 1997年、細野氏の手記は米国のタイタニック号研究財団を検証を経て事実と証明された。 1998年に日本のメディアが公開した細野氏の手記の一部には、当時救命艇の指揮員が「もう二人」と叫ぶ声がして、一等客室の男性が飛び込んだの続いて細野氏も飛び込んだとある。 あの事故で多くの人が命を落としたため、生きて帰った細野氏は、その罪悪感から帰国後誰にも反駁することをしなかったのではないかと言われている。 「中国網日本語版(チャイナネット)」2013年10月8日.

次の

タイタニック号で命拾いをした唯一の日本人_中国網_日本語

タイタニック 号 生存 者

はじめに この記事はの 24日目の記事です。 株式会社Gizumoというまだ出来て半年という若い会社でWebアプリエンジニアやってるです。 アドベントカレンダー2回目の記事になります。 一回目の記事は「」です。 よければ合わせてご覧下さい。 お題 まずはじめにKaggleを知っておきましょう。 とは Kaggleは企業や研究者がデータを投稿し、世界中の統計家やデータ分析家がその最適モデルを競い合う、予測モデリング及び分析手法関連プラットフォーム及びその運営会社である。 -- より 引用にある通り、企業などがデータを投稿して、それに対して分析やモデリングをして最適なモデリングを競い合うサイトです。 データを投稿してコンペを開催する企業側などにとっては、優秀なデータサイエンティストのリクルーティングに使えること、 コンペに参加する人は自分の実力を図ったり勉強のためだったりと、双方にメリットがあるプラットフォームになっています。 またコンペによっては賞金が出たりするものもあり、300万ドル 3. 5億円 の賞金が出るコンペもあったりするようです。 も公開しており、ここに載れば優秀なデータサイエンティストとして世界中から注目され引く手あまたとなります。 GitHubでのスター数がステータスとなるように、データサイエンティストにとってはランキングがステータスになるんだと思います。 と夏にニュースで話題となり、日本でもKaggleの知名度がドンと増したと思います。 僕もこのニュースでKaggleの存在を知った口です(テヘ) 最近は歩けばどこもかしこも「データサイエンス」やら「機械学習」やら「人工知能」などの単語が聞こえてくるようになりました。 当然流行りもの好きな僕は黙っているわけにはいきません。 ということで今回はKaggleでチュートリアル的なコンペの1つである「」に挑戦してみたいと思います。 ちなみに実行環境は以下の通りです。 数値計算系ライブラリを色々入れるのが面倒くさかったんで入れました。 Python3. iPython notebook データの用意 まずはデータを用意しましょう。 まずはに飛びます。 左にあるダッシュボードの「」からデータをダウンロードします。 とりあえずよくわからないのでそれっぽい以下のcsvをダウンロードしてきます。 train. csv 59. 76 kb• test. csv 27. 96 kb 中身を見てみると train. csvには約900人分の乗客リスト(生存結果あり)、 test. csvには約400人の乗客リスト(生存結果不明)になっていますね。 名前から察するにtrain. csvから予測モデルを作り、実際にtest. csvの乗客リストをテストして予測してみる…という流れでしょうか。。 7割くらいのデータから予測モデルを立てて残り3割くらいのデータでテストする、というのはどこかで聞いた覚えがあるのでまさにこれですね。 最初からデータが別れているのはありがたいです。 ランダムフォレスト ランダムフォレストを使って予測してねとコンペタイトルにあるのでランダムフォレストを使えばいいんでしょうか。 そもそもランダムフォレストってなんぞや?ということでWikiで調べてみました。 2001年に Leo Breiman によって提案された[1]機械学習のアルゴリズムであり、分類、回帰、クラスタリングに用いられる。 決定木を弱学習器とする集団学習アルゴリズムであり、この名称は、ランダムサンプリングされたトレーニングデータによって学習した多数の決定木を使用することによる。 対象によっては、同じく集団学習を用いるブースティングよりも有効とされる。 -- より そもそも決定木とは 決定木は学習アルゴリズムの1つで、質問してYes、Noで分岐していき、木構造を作成することで完成されます。 「完全に答えが出るまで分岐させ、これ以上分岐できないのであれば、そこで終わり」 というアルゴリズムです。 -- つまり多数の決定木で集団学習(アンサンブル学習)させることで精度を高める集団学習モデルのことらしいです。 そしていかにして決定木を作っていくことが学習モデルの肝になるようです。 データを見てみる train. csvを開いて眺めてみます。 まずは変数の意味を調べてみました。 PassengerID: 乗客ID• Survived: 生存結果 1: 生存, 2: 死亡• Pclass: 乗客の階級 1が一番位が高いそう• Name: 乗客の名前• Sex: 性別• Age: 年齢• SibSp 兄弟、配偶者の数。 Parch 両親、子供の数。 Ticket チケット番号。 Fare 乗船料金。 Cabin 部屋番号• Embarked 乗船した港 Cherbourg、Queenstown、Southamptonの3種類があります とりあえずcsvを読み込んでみましょう。 データ加工、集計が得意なpandasを使います。 性別がmale,femaleと扱いづらいので、 male:男性は0,female:女性は1として扱います。 import pandas as pd import matplotlib. csv". replace "male" , 0. replace "female" , 1 欠損値の扱い Ageにはいくつか欠損してるレコードがありますね。 欠損しているところには何かしら値を埋める必要があるそうですが、とりあえず0とかで埋めると後の予測モデルに影響が出ます。 今回の場合はレンジがそんなに広くないので全乗客の年齢の平均値でもいいんですが、こういう場合は中央値を使うのが無難だと思うので欠損しているところは中央値を当てはめるようにします。 append df [ df. 一等客室の乗客は半分以上が生き残っているようです。 おそらく一等客室の乗客が優先されて救命ボートに乗ったのだと思います。 次に年齢ごとにヒストグラムを出してみます。 これは先程欠損値に中央値を代わりに入れてしまったのが原因でした。 年齢が欠損している人は省いてヒストグラムを出力し直してみます。 いい感じの形になりました。 見てみると意外とお年寄りが亡くなっています。 反対に幼児はかなり生存率が高いですね。 ここから察するに赤ちゃんを連れた人は優先して救命ボートに乗れたようです。 データ整形 データを見ていて思っていたのが、5人以上などの大家族は生存率が低いということです。 チケット番号を見るとユニークではないらしく番号が被る人たちもいるようです。 同じ部屋だったのか、それともまとめて購入すると同じ番号になるのかはわかりません。 例えば「347082」のチケット番号の人たちはみんなファミリーネーム?が「Andersson」と共通です。 年齢を見てみるとどうやら7人家族のようです。 グレードは3なので下の階層の部屋だったのでしょうか、全員死亡しています。 「家族の人数」用の変数を追加します。 そして不要な変数を削除します。 df2. dtypes 出力結果 PassengerId int64 Survived int64 Pclass int64 Sex int64 Age float64 FamilySize int64 dtype : object 問題なく渡せそうですね。 実際に学習させてみる scikit-learnはpythonのための機械学習ライブラリです。 RandomForestClassifierを使って決定木を作成し予測します。 ただし学習データとして必要なのはPclass以降の変数なので分離します。 PassengerIdはkaggleが勝手に振ったIDなので要りません。 生存結果であるSurvivedは正解データとします。 from sklearn. csv". replace "male" , 0. fillna df. Age. astype int , output. そして最後にリストをcsvに書き込みましょう。 csvが出来ているはずです。 astype int , output. astype int : writer. writerow [ pid , survived ] KaggleにSubmitする 予測モデルを立てて実際に生存予測をしたcsvができました。 これをKaggleに送りつけましょう。 すると最終的にスコアが表示されてランキングにのります。 スコアが0. 69856でした。 ベースラインのスコアが0. 76555なので足りませんね。。 笑 今回は予測モデルを立ててKaggleに送りつけるところまでがミッションだったので、まぁよしとしましょう。。 まとめ 僕は最初は機械学習系アルゴリズムの本を買って読んだりしていましたが、まずはライブラリを使って試してみることが一番いいのかなと感じました。 Kaggleという素敵なサイトがあるのでここで腕試しや、他人の書いたスクリプトを見て研究したりしてみるのもいいのかもしれませんね。 ぜひ機械学習ライフを始めてみてはいかがでしょうか。 参考サイト.

次の