精神科後期研修のおすすめ書籍アンケートの前調査ですが、現時点で収集したデータについて、csvファイルの読み込み・データクリーニング・図示までをRで操作してみました。この文章は R Notebookで作成しています。コードは右上の CODEからダウンロードすることができます。

初期設定

  • Rを始めるときは、その都度使用する道具(パッケージ)を選択する必要があります。今回使用するパッケージ(群)は tidyverse のみです。
if (!require("tidyverse")) install.packages("tidyverse")
library(tidyverse) 

データの読み込み

  • read_csv() で .csv ファイルを読み込みます。
  • 読みこんだ .csv ファイルを <- で dat と名前をつけます。
dat <- read_csv("../materials/list_210423.csv")
Missing column names filled in: 'X2' [2], 'X5' [5]
─ Column specification ──────────────
cols(
  Timestamp = col_character(),
  X2 = col_logical(),
  年齢をお選びください = col_character(),
  `オススメ書籍はどれですか?(複数回答可)` = col_character(),
  X5 = col_character()
)
dat

と入力することで、読み込んだ csv ファイルを表示します。

dat

列名の変更

rename() を使って扱いやすい列名に変更しておきます。

dat <- dat %>% 
  rename(age = "年齢をお選びください",
         book = "オススメ書籍はどれですか?(複数回答可)",
         comment = "X5")
  • 必要の無い列を select() で選択して外します。
  • 行の番号を rownames_to_column() で追加します。
  • これを dat1 とします。
dat1 <- dat %>%
  select(-Timestamp, -X2, -comment) %>% 
  rownames_to_column() 
dat1

最初に比べて必要な列が抽出でき、すっきりとしました。

列を整える

book列は複数選択したものが セミコロン(;)でつながっています。

dat1 %>% select(book)

これを、 separate() で ; を区切りに別の列に展開していきます。


col_list <- 1:20 %>% str_c("f", .)

dat1 <- dat1 %>% separate(book,
                 into =col_list,
                 sep =";",
                 extra ="merge")
Expected 20 pieces. Missing pieces filled with `NA` in 13 rows [1, 4, 5, 6, 8, 9, 10, 11, 12, 13, 14, 15, 17].
dat1

横長の列ができました。

  • これを、データで扱いやすいように、pivot_longer()で、縦長のデータセットに変形します。
  • 本の名前を book 列に集めます。
  • 併せて、filter(!is.na(book)) とすることで、book 列が欠損値である行を除きます。
dat1 <- dat1 %>% 
  pivot_longer(
  f1:f20,
  names_to = "f",
  values_to = "book"
) %>% 
  filter(!is.na(book))

dat1

データの集計

  • group_by(book)として、本の種類毎に集計(count列)していきます。 その後に、arrange()を使って、1. count の大きい順、2. bookの文字数が多い順、に並べて、行番号を rowname_to_column() で挿入し、mutate()で整数にデータ型を指定します。
  • この行番号は、図の作成のときに使用します。
dat2 <- dat1 %>% 
  group_by(book) %>% 
  summarise(count = n())

dat2 <- dat2 %>% 
  arrange(desc(count), desc(str_length(book))) %>% 
  rownames_to_column() %>% 
  mutate(across(rowname, ~ as.integer(.x)))

dat2

棒グラフの図示

  • これから ggplot() を使って、棒グラフを作成していきます。
  • aes() で x軸を、book列、 y軸を count列で指定します。
  • x軸の順番を reorder() の X で先程作成した rowname の降順 desc() として指定します。
g1 <- dat2 %>% 
  ggplot() +
  aes(x = reorder( x = book, X = desc(rowname)), y = count, fill = count) +
  geom_col()

g1

  • x軸の文字が潰れて見えなくなっています。x軸の傾きを調整することもできますが、今回は coord_flip() 縦と横を変形します。
  • ggplot() は 先程作成したオブジェクト g1 に + で続きを入力することで、図の設定を書き足していくことができます。
g2 <- g1 + 
  coord_flip() 

g2

  • x軸とy軸の位置を scale_x_discrete(), scale_y_continuous() で調整します。
  • scale_fill_continuous() を使って、任意の色でグラデーションを付けてみます。
  • labs()を使って x軸とy軸を非表示にします。
g3 <- g2 + 
  scale_x_discrete(position = "top") +
  scale_y_continuous(position = "right") +
  scale_fill_continuous(low = "#DD8A90", high = "#BD4670") +
  labs(x = "", y = "") +
  theme_minimal() + 
  theme(legend.position = "none")

g3

関数を作成する

これまでの dat2 以降の一連の流れを関数にしてみます

  • データの集計を、make_aggregate()
  • グラフの作成を、make_graph()

とします。

make_aggregate <- function(df) {
  df %>%
    group_by(book) %>% 
    summarise(count = n()) %>% 
    arrange(desc(count), desc(str_length(book))) %>% 
    rownames_to_column() %>% 
    mutate(across(rowname, ~ as.integer(.x)))
}

make_graph <- function(df) {
  df %>%
    ggplot() +
    aes(x = reorder( x = book, X = desc(rowname)), y = count, fill = count) +
    geom_col() + 
    coord_flip() +
    scale_x_discrete(position = "top") +
    scale_y_continuous(position = "right") +
    scale_fill_continuous(low = "#DD8A90", high = "#BD4670") +
    labs(x = "", y = "") +
    theme_minimal() + 
    theme(legend.position = "none")
}

こうして、作成した関数にデータを渡すだけで同様の作業が繰り返すことができます。

dat1 %>% 
  make_aggregate() %>%
  make_graph()

年代ごとに集計する

今回集計した age 列を活用してみます。 group_by()に book に加えて age を入力することで、ageとbookで集計する事ができます。

dat3 <- dat1 %>% 
  group_by(book, age) %>% 
  summarise(count = n()) 
`summarise()` has grouped output by 'book'. You can override using the `.groups` argument.
dat3

並び順を先程作成した dat2 と一緒にします。

  • right_join()を使って、先程作成したdat2の並び順 (rowname) をdat3に突合(merge) します。
dat3 <- dat2 %>% 
  select(rowname, book) %>% 
  right_join(., dat3)
Joining, by = "book"
dat3

年代ごとの棒グラフを図示

先程完成した棒グラフ make_graph() を使ってみます。

h1 <- dat3 %>% make_graph()
h1

このままだと、book列が併せて集計されたままになるので、 facet_wrap()を使って、年代ごとに分けて表示します。

h2 <- h1 + facet_wrap(age ~ .) 
h2

図の保存

ここまでで作成したg3とh1をggsave()を使って、.tiffとして保存します。compression = “lzw” を入れることで、サイズを大幅に圧縮して保存することができます。

ggsave(plot = g3, filename = "figure1.tiff", width = 10, height = 10, dpi =300, compression = "lzw")

ggsave(plot = h2, filename = "figure2.tiff", width = 10, height = 10, dpi =300, compression = "lzw")

pdfで保存することもできます。


ggsave(plot = g3, filename = "figure1.pdf",  device = cairo_pdf, width = 10, height = 10, dpi =300)

ggsave(plot = h2, "figure2.pdf",  device = cairo_pdf, width = 10, height = 10, dpi =300)

コメント欄

コメント欄をarrange()で文字数の多い順に並べたあと、select()で抜き出して表示します。

t1 <- dat %>% 
  arrange(desc(str_length(comment))) %>% 
  select(comment) %>% 
  na.omit() 

t1

コメント欄を .png で保存

gt パッケージを使って、コメント欄を .png で保存してみます。 その他、pdf や html などで保存することも可能です。

if (!require("gt")) install.packages("gt")
library(gt) 
t2 <- t1 %>% gt()

gtsave(data = t2, "table1.png")
gtsave(data = t2, "table1.html")
gtsave(data = t2, "table1.pdf")

t2
comment
「ケースでわかる! 精神科治療ガイドラインのトリセツ」 EGUIDEプロジェクトによるもので実臨床で困った時にどう問題を整理するかやガイドラインを元にどう考えるかが分かりやすく解説されています。 「脳波判読オープンキャンパス 誰でも学べる7STEP」 電極の名前などの基礎の基礎から、波の見方、部位の特定、デジタル脳波を読むための基本など古典的教科書を見ても今一つよくわからなかったところもわかりやすく解説されています。 「ポケット臨床脳波」 こちらはいまだ記録紙による脳波が現役のところの方に。必要最低限のメモとして、また今は薬屋さんからもらえなくなった脳波定規が付録で付いてきます。 「精神・心理症状学ハンドブック[第3版]」 精神科症候学について、精神機能別にまとめられているので、わかりやすいと思います。
今日の精神疾患治療指針(いわゆるアンチョコ本ですが、右も左も分からず外来をやるときには役立ちました)、精神・心理機能評価ハンドブック(各種スケールの解釈の仕方が載っていて役立ちます)、メモリークリニック診療マニュアル(認知症外来をやっているときに要点がコンパクトに載っていて役立ちます)、精神科臨床144のQ&A(他の本には載っていないような、かゆいところに手の届くトピックが役立ちます)、精神科リハビリテーション・ワークブック(患者さんに疾病のことについて、わかりやすく説明をするときに役立ちます)
・精神医学入門 西丸四方 今ではなかなか見られない患者さんの写真が載っていてイメージしやすい。 ・健康ライブラリーシリーズ 患者さんが読みやすい、疾患教育にも有用 ・摂食障害 切池信夫 摂食障害のイロハを学ぶのに ・精神科身体合併症マニュアル 当直のお供に ・医学論文のための統計手法の選び方使い方 阿部貴行 読みやすい統計の本
読んだことがない本も多かったのですが、見覚えのある本に関してはほぼ全てをオススメとさせていただきました。精神科レジデントが自前ですべて持っている必要はないと思いますが、きちんとした教科書やDSM-5のマニュアルなどは医局で必ず1冊あった方が良いと思います。
私自身の向き不向きというものもあるでしょうが、やはりDSM-5とガイドラインが基本かと思います。下手にあれこれ手を出すと苦労します。
CBT好きとしては、精神療法の基本: 支持から認知行動療法まで、がおすすめです。
今日の治療薬(各章初めのまとめ文章が良い)、精神科レジデントマニュアル
精神療法家の仕事(どの学年になっても、その時々で学びがあります)
現代臨床精神医学 読みやすい上にある程度網羅されているため。
大人の発達障害ってそういうことだったのか
テスト:テストなので
精神療法の第一歩

作成したファイルの確認

それぞれ作成したファイル(pdf)は下記の通り

comment.pdf は一旦htmlにしたものをブラウザ(Chrome)からpdfに変換しました。

また、アンケート終了後に、再度 R で解析します。

ご意見や質問等あれば、お問い合わせや、twitter からお気軽にご連絡ください。

---
title: "精神科後期研修おすすめ書籍"
subtitle: "pilot 版"
author: "author: [shoei05](https://plaza.umin.ac.jp/shoei05/){target='_blank'}"
date: "date: 2021/05/06"
output: 
  html_notebook:
     theme: cerulean
     toc: yes
     toc_depth: 3
     toc_float: yes
     df_print: "paged"
---

**精神科後期研修のおすすめ書籍アンケート**の前調査ですが、現時点で収集したデータについて、csvファイルの読み込み・データクリーニング・図示までをRで操作してみました。この文章は R Notebookで作成しています。**コードは右上の CODEからダウンロード**することができます。

# 初期設定

- Rを始めるときは、その都度使用する道具（パッケージ）を選択する必要があります。今回使用するパッケージ(群)は **tidyverse** のみです。

```{r}
if (!require("tidyverse")) install.packages("tidyverse")
library(tidyverse) 
```

# データの読み込み

- read_csv() で .csv ファイルを読み込みます。
- 読みこんだ .csv ファイルを <- で dat と名前をつけます。

```{r}
dat <- read_csv("../materials/list_210423.csv")
```

```
dat
```
と入力することで、読み込んだ csv ファイルを表示します。

```{r}
dat
```

# 列名の変更

rename() を使って扱いやすい列名に変更しておきます。

```{r}
dat <- dat %>% 
  rename(age = "年齢をお選びください",
         book = "オススメ書籍はどれですか？（複数回答可）",
         comment = "X5")
```

- 必要の無い列を select() で選択して外します。
- 行の番号を rownames_to_column() で追加します。
- これを dat1 とします。

```{r}
dat1 <- dat %>%
  select(-Timestamp, -X2, -comment) %>% 
  rownames_to_column() 
```

```{r}
dat1
```

最初に比べて必要な列が抽出でき、すっきりとしました。

# 列を整える

book列は複数選択したものが **セミコロン(;)**でつながっています。

```{r}
dat1 %>% select(book)
```

これを、 separate() で **; を区切りに別の列に展開**していきます。

```{r}

col_list <- 1:20 %>% str_c("f", .)

dat1 <- dat1 %>% separate(book,
                 into =col_list,
                 sep =";",
                 extra ="merge")

dat1
```

横長の列ができました。

- これを、データで扱いやすいように、pivot_longer()で、縦長のデータセットに変形します。
- 本の名前を book 列に集めます。
- 併せて、filter(!is.na(book)) とすることで、book 列が欠損値である行を除きます。

```{r}
dat1 <- dat1 %>% 
  pivot_longer(
  f1:f20,
  names_to = "f",
  values_to = "book"
) %>% 
  filter(!is.na(book))

dat1
```

# データの集計

- group_by(book)として、本の種類毎に集計（count列）していきます。
その後に、arrange()を使って、1. count の大きい順、2. bookの文字数が多い順、に並べて、行番号を rowname_to_column() で挿入し、mutate()で整数にデータ型を指定します。
- この行番号は、図の作成のときに使用します。

```{r}
dat2 <- dat1 %>% 
  group_by(book) %>% 
  summarise(count = n())

dat2 <- dat2 %>% 
  arrange(desc(count), desc(str_length(book))) %>% 
  rownames_to_column() %>% 
  mutate(across(rowname, ~ as.integer(.x)))

dat2
```

# 棒グラフの図示

- これから ggplot() を使って、棒グラフを作成していきます。
- aes() で x軸を、book列、 y軸を count列で指定します。
- x軸の順番を reorder() の X で先程作成した rowname の降順 desc() として指定します。

```{r}
g1 <- dat2 %>% 
  ggplot() +
  aes(x = reorder( x = book, X = desc(rowname)), y = count, fill = count) +
  geom_col()

g1
```

- x軸の文字が潰れて見えなくなっています。x軸の傾きを調整することもできますが、今回は coord_flip() 縦と横を変形します。
- ggplot() は 先程作成したオブジェクト g1 に + で続きを入力することで、図の設定を書き足していくことができます。

```{r}
g2 <- g1 + 
  coord_flip() 

g2
```

- x軸とy軸の位置を scale_x_discrete(), scale_y_continuous() で調整します。
- scale_fill_continuous() を使って、任意の色でグラデーションを付けてみます。
- labs()を使って x軸とy軸を非表示にします。

```{r}
g3 <- g2 + 
  scale_x_discrete(position = "top") +
  scale_y_continuous(position = "right") +
  scale_fill_continuous(low = "#DD8A90", high = "#BD4670") +
  labs(x = "", y = "") +
  theme_minimal() + 
  theme(legend.position = "none")

g3
```

# 関数を作成する

これまでの dat2 以降の一連の流れを関数にしてみます

- データの集計を、make_aggregate()
- グラフの作成を、make_graph()

とします。

```{r}
make_aggregate <- function(df) {
  df %>%
    group_by(book) %>% 
    summarise(count = n()) %>% 
    arrange(desc(count), desc(str_length(book))) %>% 
    rownames_to_column() %>% 
    mutate(across(rowname, ~ as.integer(.x)))
}

make_graph <- function(df) {
  df %>%
    ggplot() +
    aes(x = reorder( x = book, X = desc(rowname)), y = count, fill = count) +
    geom_col() + 
    coord_flip() +
    scale_x_discrete(position = "top") +
    scale_y_continuous(position = "right") +
    scale_fill_continuous(low = "#DD8A90", high = "#BD4670") +
    labs(x = "", y = "") +
    theme_minimal() + 
    theme(legend.position = "none")
}
```

こうして、作成した関数にデータを渡すだけで同様の作業が繰り返すことができます。

```{r}
dat1 %>% 
  make_aggregate() %>%
  make_graph()
```

# 年代ごとに集計する

今回集計した age 列を活用してみます。
group_by()に book に加えて age を入力することで、ageとbookで集計する事ができます。

```{r}
dat3 <- dat1 %>% 
  group_by(book, age) %>% 
  summarise(count = n()) 

dat3
```

並び順を先程作成した dat2 と一緒にします。

- right_join()を使って、先程作成したdat2の並び順 (rowname) をdat3に突合(merge) します。

```{r}
dat3 <- dat2 %>% 
  select(rowname, book) %>% 
  right_join(., dat3)

dat3
```

# 年代ごとの棒グラフを図示

先程完成した棒グラフ make_graph() を使ってみます。

```{r}
h1 <- dat3 %>% make_graph()
h1
```

このままだと、book列が併せて集計されたままになるので、
facet_wrap()を使って、年代ごとに分けて表示します。 

```{r}
h2 <- h1 + facet_wrap(age ~ .) 
h2
```

# 図の保存

ここまでで作成したg3とh1をggsave()を使って、.tiffとして保存します。compression = "lzw" を入れることで、サイズを大幅に圧縮して保存することができます。

```{r}
ggsave(plot = g3, filename = "figure1.tiff", width = 10, height = 10, dpi =300, compression = "lzw")

ggsave(plot = h2, filename = "figure2.tiff", width = 10, height = 10, dpi =300, compression = "lzw")
```

pdfで保存することもできます。

```{r}

ggsave(plot = g3, filename = "figure1.pdf",  device = cairo_pdf, width = 10, height = 10, dpi =300)

ggsave(plot = h2, "figure2.pdf",  device = cairo_pdf, width = 10, height = 10, dpi =300)
```

# コメント欄

コメント欄をarrange()で文字数の多い順に並べたあと、select()で抜き出して表示します。

```{r}
t1 <- dat %>% 
  arrange(desc(str_length(comment))) %>% 
  select(comment) %>% 
  na.omit() 

t1
```


```{r, include=FALSE}
# search_word <- list("ケースでわかる! 精神科治療ガイドラインのトリセツ",
#                  "大人の発達障害ってそういうことだったのか",
#                  "脳波判読オープンキャンパス 誰でも学べる7STEP",
#                  "ポケット臨床脳波",
#                  "精神・心理症状学ハンドブック[第3版]",
#                  "今日の精神疾患治療指針",
#                  "精神・心理機能評価ハンドブック",
#                  "メモリークリニック診療マニュアル",
#                  "精神科臨床144のQ&A",
#                  "精神科リハビリテーション・ワークブック",
#                  "精神医学入門　西丸四方",
#                  "健康ライブラリーシリーズ",
#                  "摂食障害　切池信夫",
#                  "精神科身体合併症マニュアル",
#                  "医学論文のための統計手法の選び方使い方　阿部貴行",
#                  "DSM-5",
#                  "ガイドライン",
#                  "精神療法の基本: 支持から認知行動療法まで",
#                  "今日の治療薬",
#                  "精神科レジデントマニュアル",
#                  "精神療法家の仕事",
#                  "現代臨床精神医学",
#                  "大人の発達障害ってそういうことだったのか",
#                  "精神療法の第一歩"
#                  )
```

# コメント欄を .png で保存

gt パッケージを使って、コメント欄を .png で保存してみます。
その他、pdf や html などで保存することも可能です。

```{r}
if (!require("gt")) install.packages("gt")
library(gt) 
```

```{r}
t2 <- t1 %>% gt()

gtsave(data = t2, "table1.png")
gtsave(data = t2, "table1.html")
gtsave(data = t2, "table1.pdf")

t2
```

# 作成したファイルの確認

それぞれ作成したファイル（pdf）は下記の通り

- [figure1.pdf](https://plaza.umin.ac.jp/shoei05/wp/wp-content/uploads/2021/05/figure1.pdf){target="_blank"}
- [figure2.pdf](https://plaza.umin.ac.jp/shoei05/wp/wp-content/uploads/2021/05/figure2.pdf){target="_blank"}
- [comment.pdf](https://plaza.umin.ac.jp/shoei05/wp/wp-content/uploads/2021/05/comment.pdf){target="_blank"}

comment.pdf は一旦htmlにしたものをブラウザ（Chrome）からpdfに変換しました。

また、アンケート終了後に、再度 R で解析します。

ご意見や質問等あれば、[お問い合わせ](https://plaza.umin.ac.jp/shoei05/wp/index.php/contact_us/){target="_blank"}や、[twitter](https://twitter.com/shoei05){target="_blank"} からお気軽にご連絡ください。
