R epibasixを触ってみた

epibasixパッケージの関数を試して見ました

sensSpec関数

このRコードは、疫学研究において新しい検査法や自己報告を現行のゴールドスタンダードと比較する際に、感度、特異度、Youden指数、および一致率を計算するためのものです。

library(epibasix)

# This function is designed to calculate Sensitivity, Specificity, Youden’s J and Percent Agreement.
# These tools are used to assess the validity of a new instrument or self-report against the current
# gold standard. In general, self-report is less expensive, but may be subject to information bias.
# Computational formulae can be found in the reference.

dat <- cbind(c(18,1), c(19,11))
summary(sensSpec(dat))

# Szklo M and Nieto FJ. Epidemiology: Beyond the Basics, Jones and Bartlett: Boston, 2007 P.315
  • 感度 (Sensitivity): 検査法が疾患を正しく検出する能力を評価します。感度は、疾患の存在する人々のうち、検査で陽性と判定された割合を示します。
  • 特異度 (Specificity): 検査法が健康な人々を正しく陰性と判定する能力を評価します。特異度は、健康な人々のうち、検査で陰性と判定された割合を示します。
  • Youden指数 (J): Youden指数は、感度と特異度のバランスを示す指標です。Youden指数は、感度と特異度の和から1を引いた値で計算されます。Youden指数が高いほど、検査法の性能が良いことを意味します。
  • 一致率 (Percent Agreement): 現行のゴールドスタンダードと新しい検査法の結果が一致する割合を示します。一致率は、両者の結果が同じと判定された割合です。

このコードでは、epibasixパッケージを使用して、与えられたデータセットから感度、特異度、Youden指数、および一致率を計算しています。具体的な計算式は、参考文献で確認できます1

このような指標を使用することで、新しい検査法の有効性を評価し、疫学研究において適切な判断を行うことができます。

sensSpec関数の実行結果

> summary(sensSpec(dat))

 Detailed Sensitivity and Specitivity Output 
 
Input Matrix: 
           Gold Standard A Gold Standard B
Reported A              18              19
Reported B               1              11

The sample sensitivity is: 94.7% 
95% Confidence Limits for true sensitivity are: [84.7, 104.8]

The sample of specificity is: 36.7% 
95% Confidence Limits for true specificity are: [19.4, 53.9]

The sample value of Youden's J is: 31.4
95% Confidence Limits for Youden's J are: [11.4, 51.4]

Sample value for Percent Agreement (PA) is: 59.2% 
95% Confidence Limits for PA are: [45.4, 72.9]

ま、そういう事みたいです。

univar関数

このRコードは、単一の変数に対する詳細な単変量解析を提供します。具体的には、以下の統計量を計算します:

  • 平均 (mean): 観測値の平均値。
  • 中央値 (median): 観測値の中央値。
  • 標準偏差 (standard deviation): 観測値のばらつきの尺度。
  • 範囲 (range): 観測値の最小値から最大値までの幅。
  • 仮説検定と信頼区間のツール

具体的な使用方法は次の通りです:

#This function provides detailed univariate analysis for a single variable. Values include the sample
# mean, median, standard deviation and range, as well as tools for hypothesis tests and confidence
# intervals.

x <- rexp(100)
univar(x)

# Casella G and Berger RL. Statistical Inference (2nd Ed.) Duxbury: New York, 2002.

univar関数の実行結果

> x <- rexp(100)
> univar(x)

Univariate Summary
 
Sample Size: 100
Sample Mean: 0.972 
Sample Median: 0.632 
Sample Standard Deviation: 0.986 

ま、このパッケージは他のものでカバーできそうかな

 

Rで二項分布をまとめて計算

二項分布をまとめて計算

はじめに

複数の頻度と95%信頼区間を計算したい。普段、頻度とその95%信頼区間はbinom.test(a, b)を用いて計算しています。これに、データフレームのデータを流し込んで一気に、頻度 estimateと信頼区間の上限upperと下限lowerの値をベクトルとして得たい。

サンプルコード

bunsi <- c(1, 2, 3, 4)
bunbo <- c(10, 15, 16, 20)
df <- data.frame(bunsi, bunbo)

result <- mapply( binom.test, df$bunsi, df$bunbo ) 
estimates <- unlist(result[5,]) # estimate, 頻度
conf_int <- matrix ( unlist(result[4,]) , byrow=F, nrow=2 ) # conf.int
lower <- conf_int[1,]
upper <- conf_int[2,]

解説

このRスクリプトは、4つの異なる二項分布に関する二項検定を行っています。 まず、ベクトル`bunsi`と`bunbo`が定義されており、それぞれ成功回数と試行回数を表しています。

次に、これらのベクトルを使用してデータフレーム`df`が作成されます。

`mapply`関数は、`binom.test`を用いて、`df`の各行について二項検定を行います。`binom.test`は、二項分布における成功の確率を推定し、その確率が指定した値(デフォルトでは0.5)から有意に異なるかどうかを検定します。

結果のリストから、`estimates`(推定値)と`conf_int`(信頼区間)が抽出されます。`estimates`は成功の確率の推定値を、`conf_int`はその95%信頼区間を表しています。

最後に、信頼区間の下限`lower`と上限`upper`が抽出されています。 したがって、このスクリプトは4つの二項分布の成功確率を推定し、その信頼区間を計算しています。

二重ルーターになっていないか

二重ルーター

自宅のネットが遅いとき、ハブのつもりで設定している機器が複数ルーターになっていたら、それを解消するだけで良くなるかもしれません。

方法

windows 標準プログラムにある、コマンドプロンプトで次を入力します

Tracert -d 8.8.8.8

出力に以下で始まるアドレスが2つ以上あったら、家のネットにつながっている機器の設定を片端から確認しましょう。

  • 192.
  • 172.
  • 10.

「ブリッジモード」「アクセスポイントモード(APモード)」なら〇
「ルーター」なら×

 

コマンドの意味

`tracert -d 8.8.8.8`はWindowsのコマンドプロンプトで使われるコマンドです。 ここで、`tracert`は”trace route”の略で、インターネット上のルートを追跡するためのツールです。指定された宛先ホストまでのIPネットワークルートを表示します。これはパケットが送信元から宛先までどのルートをたどるかを確認するために使用されます。 `-d`オプションは、途中のルートでの名前解決を行わないことを指示します。つまり、各ホップのIPアドレスを表示しますが、それらのIPアドレスに関連するホスト名は表示しません。 `8.8.8.8`はGoogleの公開DNSサーバの一つのIPアドレスです。 したがって、`tracert -d 8.8.8.8`コマンドは、現在のマシンからGoogleのDNSサーバまでのルートを追跡し、その各ホップのIPアドレスを表示します。 ただし、今回のプロジェクトではインターネットへのアクセスを前提としたコードを生成できないため、このコマンドをプログラム内で使用することはできません。

R データフレームのカラム名の変更

R データフレームのカラム名の変更

dplyr パッケージのrenameを使います。

rename ([新しいカラム名1] = [現在のカラム名1], …., [新しいカラム名n] = [現在のカラム名n])

library(dplyr)

LineList %>%  
  rename(Srsnss    = ILD重篤性,
         WrstGrade = ILD最悪Grade) -> LineList

この例では、Rコードはdplyrパッケージを利用しています。dplyrはデータ操作と変換を行うためのツールを提供するRパッケージです。

このコードは、LineListというデータフレームのカラム名を変更しています。具体的には、”ILD重篤性”というカラム名を”Srsnss”に変更し、”ILD最悪Grade”というカラム名を”WrstGrade”に変更しています。変更後のデータフレームはLineListRに格納されます。

%>%はパイプオペレータと呼ばれ、左側のオブジェクトを右側の関数に引数として渡す役割を果たします。これにより、コードを読みやすく、理解しやすくすることができます。

産後うつ病と誤診されたシーハン症候群の頻度、臨床症状、および経過

シーハン症候群は、産後うつ病に類似した精神科的症状を呈することが多く、診断の遅れが7〜15年に及ぶこともある。しかし、誤診の頻度に関する体系的なデータは存在せず、ホルモン補充療法によって症状は通常迅速に改善する。


産後うつ病に類似した精神科的症状の症例

  • 複数の症例報告およびケースシリーズ(Kaleら, 1999; Maneeshaら, 2024; Chiuら, 2021; Qadriら, 2015; de Silvaら, 2020)では、シーハン症候群が精神科的症状、特にうつ病や精神病として現れることが記述されている。
  • 一部の症例では、幻覚や妄想などの精神病症状が顕著であり(Chiuら, 2021; de Silvaら, 2020)、ホルモン補充療法によって改善した。
  • 他の症例では、うつ病症状が主な特徴であり(Maneeshaら, 2024; Qadriら, 2015)、初期には精神科的治療が行われた。
  • 不穏、恐怖感、認知障害などの行動変化も報告されている(Chiuら, 2021; Errarhayら, 2008; de Silvaら, 2020)。
  • これらの報告では、典型的な内分泌症状が欠如していたり見逃されていたりすることがあり、診断を困難にしていた。

誤診の頻度とパターン

  • シーハン症候群が産後うつ病と誤診される頻度を体系的に報告した研究は含まれていない。
  • 症例報告からの逸話的証拠(Kaleら, 1999; Maneeshaら, 2024; Chiuら, 2021; Qadriら, 2015; de Silvaら, 2020)では、精神科的症状が診断の遅れや見逃しにつながることが多いとされている。
  • より大規模な後ろ向き研究(Ramiandrasoaら, 2013; Sanyal & Raychaudhuri, 2012)は診断の遅れや初期症状に焦点を当てているが、精神科的誤診の割合については要旨に記載がなかった。
  • 症例報告から得られる証拠では、神経精神症状が主であり、典型的な内分泌症状が微妙または欠如している場合に誤診が起こる可能性があるが、体系的なデータがないため、正確な頻度の推定は困難である。

臨床経過と診断の遅れ

  • より大規模な症例集(Ramiandrasoaら, 2013; Sanyal & Raychaudhuri, 2012; Chiuら, 2021)では、平均7〜15年の診断遅延が報告されている。
  • 遅延の原因としては以下が挙げられている:
    • 非特異的な症状
    • 医師の認識不足
    • 精神科的症状を一次的な気分障害や精神病と誤認
  • 複数の症例報告(Maneeshaら, 2024; Qadriら, 2015; de Silvaら, 2020)では、患者が数年間精神科薬で治療された後に正しい診断が下された。
  • ホルモン補充療法により、精神科的および全身症状の迅速かつしばしば完全な改善が見られた(Kaleら, 1999; Chiuら, 2021; Errarhayら, 2008; de Silvaら, 2020)。

鑑別診断の手がかりとなる臨床所見

  • 授乳不能(無乳症)や無月経などの内分泌症状は、これらを記載した研究において信頼できる手がかりとされている(Ramiandrasoaら, 2013; Sanyal & Raychaudhuri, 2012; Errarhayら, 2008)。
  • その他の全身症状(甲状腺機能低下症、副腎不全、低ナトリウム血症、低血糖)は報告にばらつきがある(Ramiandrasoaら, 2013; Sanyal & Raychaudhuri, 2012; Errarhayら, 2008; de Silvaら, 2020)。
  • これらの症状が、産後出血の文脈で出現した場合、産後の精神科的症状を呈する女性に対してシーハン症候群を考慮する契機となる可能性があると示唆されている。

Study Study Design Population Primary Focus Psychiatric Manifestations Reported Full text retrieved
Kale et al., 1999 Case report 1 woman, 23 years Postpartum psychosis in Sheehan’s syndrome Postpartum – No psychosis No
Maneesha et al., 2024 Case report 1 woman, 39 years, multiparous Depression and dyselectrolytaemia in Sheehan’s syndrome Depression No
Ramiandrasoa et al., 2013 Retrospective cohort study 40 women (39 analyzed) Clinical features and diagnostic delay in Sheehan’s syndrome No mention No found
Diri et al., 2015 Review article Not applicable Epidemiology, clinical features, diagnosis, treatment of Sheehan’s syndrome No mention found No
Chiu et al., 2021 Case report and case series 1 woman, 42 years (case); 19 patients (series) Sheehan’s syndrome presenting as postpartum psychosis Behavioral changes, psychosis, depression Yes
Dejager et al., 1998 Case report No mention found Acute phase differential diagnosis in Sheehan’s syndrome No mention No found
Qadri et al., 2015 Case report 1 woman, 45 years Sheehan’s syndrome presenting as major depressive disorder Major depressive disorder No
Sanyal and Raychaudhuri, 2012 Retrospective case series 18 women, 28–71 years Presenting features of Sheehan’s syndrome at diagnosis No mention found No
Errarhay et al., 2008 Case report and literature review 1 woman, 40 years, three pregnancies, three births Sheehan’s syndrome with neuroendocrine and systemic manifestations Agitation, convulsions Yes
de Silva et al., 2020 Case report and literature review 1 woman, 32 years, third child Sheehan’s syndrome with psychotic manifestations Fearfulness, delusions, hallucinations, cognitive impairment No

References

Cynthia Ramiandrasoa, F. Castinetti, I. Raingeard, P. Fénichel, O. Chabre, T. Brue, and B. Courbière. “Delayed Di- agnosis of Sheehan’s Syndrome in a Developed Country: A Retrospective Cohort Study.” European Journal of Endocrinology, 2013.

D. Sanyal, and M. Raychaudhuri. “Varied Presentations of Sheehan’s Syndrome at Diagnosis: A Review of 18 Patients.” Indian Journal of Endocrinology and Metabolism, 2012.

H. Diri, Z. Karaca, F. Tanrıverdi, K. Unluhizarci, and F. Keleştimur. “Sheehan’s Syndrome: New Insights into an Old Disease.” Endocrine, 2015.

H. H. Chiu, E. M. Masamayor, Ma. Belen B. Pilit-Hizon, A. B. Uy, M. C. Ańonuevo-Cruz, and Gabriel Jasul. “Sheehan’s Syndrome Presenting as Postpartum Psychosis.” Acta Medica Philippina, 2021.

K. Kale, N. Nihalani, N. Karnik, and N. Shah. “POSTPARTUM PSYCHOSIS IN A CASE OF SHEEHAN’S SYNDROME.” Indian Journal of Psychiatry, 1999.

M. Maneesha, KS Chenthil, Vignessh Raveekumaran, and J. F. Mary. “A Rare Case of Sheehan’s Syndrome Presenting as Depression and Dyselectrolytaemia in a Multiparous Woman.” Journal of Clinical and Diagnostic Research, 2024.

Mehmood Qadri, M. Mushtaq, I. Qazi, S. Yousuf, and A. Rashid. “Sheehan’s Syndrome Presenting as Major Depressive Disorder.” Iranian Journal of Medical Sciences, 2015.

N. D. de Silva, J. Galhenage, M. Dayabandara, and N. Somasundaram. “Sheehan Syndrome Presenting with Psychotic Manifestations Mimicking Schizophrenia in a Young Female: A Case Report and Review of the Literature.” Case Reports in Endocrinology, 2020.

S. Dejager, S. Gerber, L. Foubert, and G. Turpin. “Sheehan’s Syndrome: Differential Diagnosis in the Acute Phase.” Journal of Internal Medicine, 1998.

S. Errarhay, I. Kamaoui, C. Bouchikhi, H. Chaara, Hakima Bouguern, S. Tizniti, A. Melhouf, and A. Banani. “Sheehan’s Syndrome A Case Report and Literature Review.” Libyan Journal of Medicine, 2008.

Rでデータ整理

上のようなデータがあったとして、dplyrで少し成形します

  1. filter() … 行の選択
  2. arrange() … 行の並び替え
  3. select() … 指定した列のみ選択
  4. mutate() … 新しい列の追加
  5. group_by() … グルーピング
  6. summarize() … 集計

 

tidyverse のフィルターを使って

library(tidyverse)
library(readxl)
library(dplyr)

df <- read_xlsx("0050 irAE.xlsx")

df %>%  
  filter(ir_AE == -1) %>% # ir_AE が-1(TRUEを-1で入力してある)の行のみ選択
  arrange(Time2Onset) %>% # Time2Onsetの順に並べ替え(この後平均を取るので意味なし😛)
  group_by(`医薬品(一般名)`, irAE ) %>% # 医薬品およびirAEごとにグループ化
  summarise(avTO = mean(Time2Onset))  -> newDF # 医薬品・irAE毎のTime2Onset平均値を計算して、newDFというデータフレームへ書き出す

以下のような出力になりました

 

解説

このRスクリプトは、指定されたExcelファイルからデータを読み込み、特定の条件に基づいてデータをフィルタリング、並べ替え、グループ化し、平均値を計算します。

まず、”tidyverse”と”readxl”、”dplyr”という3つのRパッケージを読み込みます。

次に、read_xlsx関数を使用して、指定されたExcelファイル(“0050 irAE.xlsx”)からデータを読み込み、dfという名前のデータフレームに格納します。

その後、dfデータフレームを使用して、ir_AE列が-1(TRUEを-1で入力してある)の行のみを選択します。さらに、Time2Onset列の値を基準に昇順に並べ替えます(ただし、この後の平均値の計算には影響しません)。

次に、医薬品(一般名)とirAEの値を基準にグループ化し、それぞれのグループごとにTime2Onsetの平均値を計算します。計算結果は、”医薬品(一般名)”と”irAE”、”avTO”という列名を持つ新しいデータフレームnewDFに格納されます。

以上が、このRスクリプトの動作です。

便利そうなサイト

フリー写真素材の検索

O-DAN (オーダン)- 無料写真素材・フリーフォト検索

日本語で検索出来て、キーワードに沿ったフリーの写真を提示してくれます。

写真をクリックしたら、フリー素材提供元のサイトへ飛びます。

 

セキュリティチェックサイト

URL(リンク・サイト・ホームページ)の安全・危険、リンクスパム・ウイルスや詐欺フィッシングをチェック、短縮URLの展開・解析、サイトキャプチャ取得も可能。 (securl.nu)

接続する前に安全性をチェック

 

捨てアドサイト

ワンクリックでアドレス発行!「ワンタイムメール」 (onetime-mail.com)

一時的に利用したいメールアドレスをweb上で作成できるサイト

1週間使用できるアドレスが生成されて、当該ページでメールを見ることができます。

 

昔のWebサイトの魚拓

Internet Archive: Wayback Machine

 

 

 

 

WAVLINK AC1200取説

WAVLINK AC1200という、安価な無線ルーターを使用しています。

少し電力消費が多そう(熱くなる)ので経済的でないかもしれませんが、かなり昔ですが安かったのでポチッとしました。

これを中継機として使用するにあたって、説明書がなくて困りました。ネットで調べたリンクを貼っておきます。

とりあえず、ログインするには、こいつのwifi電波に接続した上で 192.168.10.1 へ接続し、パスワードadmin (当然私はもう変更しています)で設定画面に入れます。

backup

R ggplot で複数のデータフレームを結合して描画

はじめに

こんな感じのデータがありました

xは時期 as.Date(“2024-03-08”)とかの値が入っているベクター

cancer はc(“GC”, “BC”) がん種の値が入ったベクター

y は表示したい値(平均値とか頻度とか)

low/hight はエラーバーの上限・下限(95%信頼区間とか)

何がしたいのか

データフレームをがん種別に作成した後に、それらを一つのグラフで表示したくなった

library(ggplot2)
library(ggsci)
library(scales)

BC_data_frame <- data.frame(x, cancer, y, low, high) # BCとGCでそれぞれのベクターには
GC_data_frame <- data.frame(x, cancer, y, low, high) # 異なる値が入っている

combined_data_frame <- rbind(BC_data_frame, GC_data_frame)

g5 <- ggplot(combined_data_frame, aes(x, y, color = cancer)) + 
   geom_smooth(aes(ymin = low, ymax = high), alpha = 0.2) + 
   scale_color_nejm() + 
   geom_point() + 
   geom_errorbar(aes(ymin = low, ymax = high), width = 10) + 
   scale_x_date(limits = c(as.Date("2020-05-15"), as.Date("2024-01-31")), oob = oob_keep) +
   scale_y_continuous(limits = c(0, 0.2), oob = oob_keep)
plot(g5)
ど

どうしたらどうなった

rbindで結合して、そのままプロットしたら2系列が分かれて表示された

全体はこんな感じ

setwd("C:/Users/****")

library(ggplot2)
library(ggsci)
library(scales)

x <- seq(as.Date("2020-06-01"), as.Date("2024-01-01"), by = "month")
k1 <-  binom.test(1, 11);	y <- c(k1$estimate);	low <- c(k1$conf.int[1]);	high <- c(k1$conf.int[2])
k2 <-  binom.test(1, 19);	y <- c(y, k2$estimate);	low <- c(low, k2$conf.int[1]);	high <- c(high, k2$conf.int[2])
# ... データ個所は中略
k43 <- binom.test(12, 135);	y <- c(y, k43$estimate);	low <- c(low, k43$conf.int[1]);	high <- c(high, k43$conf.int[2])
k44 <- binom.test(11, 131);	y <- c(y, k44$estimate);	low <- c(low, k44$conf.int[1]);	high <- c(high, k44$conf.int[2])
cancer <- rep("GC", 44)
GC_data_frame <- data.frame(x, cancer, y, low, high)

k1 <-  binom.test(0, 12);	y <- c(k1$estimate);	low <- c(k1$conf.int[1]);	high <- c(k1$conf.int[2])
k2 <-  binom.test(0, 118);	y <- c(y, k2$estimate);	low <- c(low, k2$conf.int[1]);	high <- c(high, k2$conf.int[2])
# ... データ個所は中略
k43 <- binom.test(2, 302);	y <- c(y, k43$estimate);	low <- c(low, k43$conf.int[1]);	high <- c(high, k43$conf.int[2])
k44 <- binom.test(3, 279);	y <- c(y, k44$estimate);	low <- c(low, k44$conf.int[1]);	high <- c(high, k44$conf.int[2])
cancer <- rep("BC", 44)
BC_data_frame <- data.frame(x, cancer, y, low, high)

combined_data_frame <- rbind(BC_data_frame, GC_data_frame)

g5 <- ggplot(combined_data_frame, aes(x, y, color = cancer)) + 
  geom_smooth(aes(ymin = low, ymax = high), alpha = 0.2) + 
  labs (title = "xxxxx in GC/BC") + 
  labs(subtitle = "xxxxx") +
  labs(    x        = "Calendar time",
           y        = "Proportion of report per exposure",
           caption  = "Error bars indicate 95% confidence interval calculated with Clopper and Pearson's method" ) +
  scale_color_nejm() + 
  geom_point() + 
  geom_errorbar(aes(ymin = low, ymax = high), width = 10) + 
  scale_x_date(limits = c(as.Date("2020-09-15"), as.Date("2024-02-01")), oob = oob_keep) + 
  scale_y_continuous(limits = c(0, 0.3), oob = oob_keep)
plot(g5)

 

 

 

R sqlが no such tableとエラーを返してきた

R でdata frameに対してsql スクリプトを実行できるパッケージのsqldfで、存在しているはずのデータフレームを指定しても’no such table’というエラーが返ってきました

関連するパッケージを最新バージョンへアップデートしたり、Rを再起動したりしたのですが効果はありませんでした。どうやらデータフレーム名に.(ドット)があるとダメなようです。

以下の試行例では、df_LineListではエラーが出ませんがdf.LineListではエラーになってしまいます

> df.LineList <- df_LineList # データフレームの内容は同じ
> df.test <- sqldf('SELECT * FROM df_LineList') # エラーなし
> df.test <- sqldf('SELECT * FROM df.LineList') # こちらではエラーが出る
 エラー: no such table: df.LineList

> class(df.LineList)
[1] "tbl_df"     "tbl"        "data.frame"
> class(df_LineList)
[1] "tbl_df"     "tbl"        "data.frame"
>

 

 

Translate »