1st Step Import ข้อมูล

Step 2 "สำราจ และ เช็คความถูกต้องของข้อมูลก่อนว่า

describe  / des

obs = จำนวน rows

var = จำนวน column

summarize  / sum



mdesc

Step 3 : วิธีดูว่าข้อมูลเป็น normal distribution มั้ย

histogram  *variable*

หรือ hist. *variable*

วิธีเช็คว่า กราฟเป็น normal distribution มั้ย มี 2 วิธี

hist age

hist age , normal

แถม 

disp  *คำนวน บวก ลบ คูณ หาร เลข*

ถ้าจะหา median , IQR 

min / criteria1  = "category_1" 

criteria1 / criteria2 = "category_2"  

criteria3 / max  = "category_3" 

, gen("name of new column")

ตัวอย่าง. recode age min/19=0 20/34=1 35/max=2, gen(newww)

สร้าง category ใน column age โดย
แบ่งเป็น กลุ่ม คือ min ถึง 19 ให้อยู่กลุ่ม 0
20 ถึง 34  ให้อยู่กลุ่ม 1
35 ถึง max ให้อยู่กลุ่ม 0
แล้วสร้าง column ใหม่ ชื่อ "neww"

ต้องระวัง

ข้อมูลที่เป็น ทศนิยม เช่น 29.99934
ถ้าเราจัด category 0-29 , 30-36 โปรแกรมจะงง ไม่สามารถจัดกลุ่มได้ ดังนั้น ต้องใส่สูตร เป็น
category 0 - 29.99999 , 30-36.99999 ตามจำนวนหลักทศนิยมของ raw data

สร้าง Column ใหม่ จากข้อมูลเดิม

 gen bmi=weight/(height/100)^2

แจกแจงความถี่ของข้อมูลเป็นจำนวนและร้อยละ โดยจำแนกตามกลุ่ม

คำสั่ง


ตัวอย่าง

    tab gender group, column exact



Pr = 0.510

ทั้ง 2 กลุ่ม ต่างกัน แต่ ไม่มีนัยสำคัญทางสติติ

 sum age if group == 0

tabstat age,by(group) stat(n mean sd median p25 p75 min max)

replace

คำสั่ง

One-way ANOVA = "oneway" เช่น oneway gestation group_1, bon

หากต้องการ เอา Data table ไปใช้งาน

1. Select. ข้อมูลที่ต้องการ

2. คลิกขวา Copy table

Save Do file

2. Save Do file ใส่นามสกุล .do

ถ้าต้องการใส่ Note 

// สำหรับ บรรทัดเดียว


สำหรับ หลายบรรทัด

/*


*/


. graph hbox age

T-test

แปรผล ถ้า เปรียบเทียบแบบไม่มีทิศทาง เช่น เพศ จะเอา Ha=diff != 0 ถ้าน้อยกว่า 0.05 ถือว่ามีนัยสำคัญ

0.89 = ทั้ง 2 กลุ่ม แตกต่างกัน แต่ไม่มีนัยสำคัญทางสถิติ

 hist age,normal by(group)

 tab atward group, col chi exact

P-value ใช้ค่าของ Pr

กรณี นี้จะใช้ p-value = < 0.001 แม้ว่าแท้จริงแล้ว P-value จะเท่ากับ 0.000 แต่ไม่มีใครเขาเขียนโอ้อวดกัน

rename gender female 

หากข้อมูล มีความสัมพันธ์กันเช่น คน คนเดีนวกันแล้ววัดค่า ก่อนทำ หลังทำ แสดงว่าตัวแปร ไม่อิสระต่อกัน ต้องใช้  "Paired t test"

สูตร  ttest varname1 == varname2

ทดสอบความแตกต่างของ proportion ด้วMcNemar test

mcc

Correlation สหสัมพันธ์

ขั้นตอนการสร้างกราฟ Correlation

Menu : Graphics > Toway graph > Create > ใส่ค่าเข้าไป > submit

corr gestation birthweight

. twoway (scatter birthweight gestation)

การสร้างกราฟ Regression 

(กราฟของ correlation)

. regress birthweight gestation

regress birthweight gestation

การหา Risk / Comparison of demographic 

แต่ถ้า งานวิจัยมีตัวแป แค่ 2 ตัว ใช้ CC หรือ CS พอ อย่าเยอะะะ

cs *x* *y*

cc *x* *y*   

x = var_case

y = var_exposed

กรณีมีตัวแปร หลายตัว (มากกว่า 2) ต้องมาคิดเพิ่มมาว่า มันมีความสัมพันธ์กันจริงๆมั้ย จะใช้ CC หรือ CS ไม่ได้ จึงต้องใช้ คำสั่งใหม่แทน คือ logistic 

logistic y, x1,x2,x3,x4,x5

logistic pph agegroup

logistic pph i.agegroup

เมื่อ i.agegroup จะทำให้ได้ Odd ratio มาซึ่ง เกิดจาก Odd ที่เราสนใจ / reference odd เช่น


ผลที่ได้จะได้


กรณี ต้องการระบุ  reference odd ให้ใส่ b เช่น 

logistic pph ib1.agegroup

  b = base ต้องใส่

  ib1 = ใช้ reference base agegroup = 1



P>|z|  = p-value

logistic pph i.agegroup i.nation nulliparous inadequateANC hxpreviouspph hxdeliver3500 hxinstrument i.bmigr fh36

กรณี มีตัวแปรเวลามาร่วมด้วย


 ir var_case var_exposed var_time

แปรผล

มีโอกาสเกิดเหตุการณ์ = 0.0001159*100*365.25

 =  4.2332475 ครั้ง/100คน/ปี

มีอัตราการเกิดเหตุการณ์ (Incident rate ratio) = 4.441478 เท่า

poisson regression for incidence rate ratio

poisson remove noliving needchild notagree spot headache dizzy nausea palpitation papule ,exp(day) irr

Survival time graph

 stset day remove

sts graph ,hazard

sts graph ,by(papule)

 diagt diag_var test_var

กรณีข้อมูล ที่ไม่ใช่ True / False เช่น ในที่นี้ เป็น grade tumor

จะต้องจัดกลุ่มให้เป็น True / False ให้ได้ เช่น

grade 1 = true , 2-5 = false

grade 1-2 = true , 3-5 = false 

grade 1-3 = true , 4-5 = false เป็นต้น  

จะเห็นว่ามีหลายเกณฑ์ แล้วเอามาดูว่า เกณฑ์ไหนดีสุด

ในความเป็นจริง เราจะดูทุกเกณฑ์ ในการวิเคราะห์ แต่ละ test

เป็นที่มาของคำว่า  ROC

ใช้สูตร  roctab  ref_var class_var 

ตัวอย่าง roctab patho fna,detail graph


roctab patho fna ,detail graph

จุดแต่ละจุด คือ แต่ละเกณฑ์ ในภาพมี 6 จุด = 6 เกณฑ์ เช่น จุดที่ 1 คือ cutpoint ≥1 

จุดประสงค์ จะเอา cut-off ไหน ขึ้นอยู่กับบริบท

stci = median survival time

.sts test gender



P-value = 0.0037 

แปลว่า มีหลักฐานทางสถิติว่าแตกต่างกัน