爰唯侦察bt核工厂
你的位置:爰唯侦察bt核工厂 > 露出 >
樱井莉亚电影 使用R道话对FAERS数据库中的数据进行清洗——③同类型表格合并
发布日期:2025-01-05 08:09    点击次数:92

樱井莉亚电影 使用R道话对FAERS数据库中的数据进行清洗——③同类型表格合并

对于批量读取,有个问题没说到:数据下载完成,挨个季度手工解压后,把同类型的表格手工复制到祛除个文献夹,这么便捷批量读取。上一篇还是把系数ASCII文献批量读取,并输出为CSV文献。今天的任务是把同类型各季度数据合并为一个CSV文献。这里触及到的第一个问题,FAERS数据库从2004年第1季度于今一直在更新完善,导致数据表格模式发生了一些变化:列名革新、加多新的列等。这就需要缕清哪些季度发生了哪些变化,然后把表格的模式一齐革新为最新的模式,便捷合并:把列名一齐革新为最新的,加多新增的列樱井莉亚电影,即使全是未知值。第二个问题樱井莉亚电影,要弄明晰我方需要哪些列的数据樱井莉亚电影,把不需要的列删除,这么能减少数据量,好像本领。底下对每种类型的表格进行处分:一、DEMODemo表格合并之前的处单干作不是在R中处分的,是我手工在excel表中手工处分的,这也算是一种方法吧,是以肤浅说一下奈那处分的,不需要设施。保留PRIMARYID列,革新老表列名ISR为PRIMARYID;保留CASEID列,革新老表列名CASE为CASEID;保留EVETNT_DT列;保留FDA_DT列;保留AGE列;保留AGE_COD列;保留GNDR_COD列;保留WT列;保留WT_COD列;保留REPT_DT列;保留OCCP_COD列;保留DEATH_DT列。把老表格中的老列名革新为新列名,同期加多新表格中新增的,老表格中莫得的列。手工EXCEL表中处分达成后,读取并合并成一个表格,合并设施在背面:批量读取,接纳上篇的设施,难得革新read_delim函数为read_excel函数或其他可用函数。二、DRUGDRUG表格的合并是接纳的R道话进行的处分;DRUG表格的模式整个发生了2次变化,换句话说需要分红三个部分批量读取和革新,然后搭救合并:2004Q1~2012Q3,2012Q4~2014Q2,2014Q3于今;把这三个阶段的文献辩认放到三个文献夹,便捷处分。1、2004Q1~2012Q3的读取和处分:#批量读取设施和上一篇雷同,区别是对不需要的列进行了删除,需要的列进行了重定名;#难得革新为我方的旅途#创建变量pathpath <- "D: /FAERS/FaersCSV/DRUGCSV/"#索要旅途文献夹里的系数文献称呼drug_names <- dir(path)#轨范称呼drug_renames <- drug_names %>%str_replace(".csv", "")#创建读取文献夹中系数文献的旅途drug_path <- sapply(drug_names, function(x){paste(path, x, sep = "/")})#读取文献夹中系数的文献,并复返listdrug_newdata <- lapply(drug_path, function(x){read_csv(x)})for (i in 1:length(drug_names)) {temp <- drug_newdata[[i]] %>%#遴荐需要的列select(ISR, DRUG_SEQ, ROLE_COD, DRUGNAME, ROUTE) %>%#重定名列,进行称呼的搭救轨范rename(primaryid = ISR, drug_seq = DRUG_SEQ, role_cod = ROLE_COD, drugname = DRUGNAME, route = ROUTE) %>%#新表格中出现的新列添加至老表格,赋值NAmutate(caseid = NA, prod_ai = NA)#输出搭救后的文献#难得革新旅途为我方的write_csv(temp, paste0("D: FAERS/FaersCSV/DrugDataCleaned/", drug_renames[i], ".csv"))}2、2012Q4~2014Q2的读取和处分:#批量读取不再赘述,和上述近似;只贴一下列的遴荐和重定名设施for (i in 1:length(drug_names)) {temp <- drug_newdata[[i]] %>%select(primaryid, caseid, drug_seq, role_cod, drugname, route) %>%mutate(prod_ai = NA)#然后和2004Q1~2012Q3输出到祛除个文献夹即可3、2014Q3于今的读取和处分:#批量读取不再赘述,和上述近似;只贴一下列的遴荐for (i in 1:length(drug_names)) {temp <- drug_newdata[[i]] %>%select(primaryid, caseid, drug_seq, role_cod, drugname, route, prod_ai) #遴荐列}#然后和2004Q1~2012Q3输出到祛除个文献夹即可4、把上述身手处分后的DRUG文献进行合并#文献旅途一齐革新为我方的#由于我在两台电脑上进行的处分,文献旅途频繁发生变化,不必纠结,革新为我方的就不错#创建变量pathpath <- "D:/DataMining/4FaersDataCleaning/DrugDataCleaning/"#索要旅途文献夹里的系数文献称呼drug_names <- dir(path)#轨范称呼drug_renames <- drug_names %>%str_replace(".csv", "")#创建读取文献夹中系数文献的旅途drug_path <- sapply(drug_names, function(x){ paste(path, x, sep = "/")})#读取文献夹中系数的文献,并复返listdrug_newdata <- lapply(drug_path, function(x){ read_csv(x)})#合并文献drug_conbine <- drug_newdata[[1]]for (i in 1:length(drug_names)) { drug_conbine <- union(drug_conbine, drug_newdata[[i]])}#输出文献write_csv(drug_conbine, "F:/DataMining/5FaersDataCombineByGroup/DrugConbined.csv")三、INDI文献读取合并身手和上述近似,只肤浅贴一下文献有变化的设施1、2004Q1~2012Q3for (i in 1:length(indi_names)) { temp <- indi_newdata[[i]] %>%#重定名列 rename(primaryid = ISR, drug_seq = DRUG_SEQ, indi_pt = INDI_PT) %>%#添加新列 mutate(caseid = NA)2、2012Q4于今for (i in 1:length(indi_names)) { temp <- indi_newdata[[i]] %>% #重定名列 rename(drug_seq = indi_drug_seq)四、OUTC文献读取合并身手和上述近似,只肤浅贴一下文献有变化的设施1、2004Q1~2012Q3for (i in 1:length(outc_names)) { temp <- outc_newdata[[i]] %>% #重定名列 rename(primaryid = ISR, outc_cod = OUTC_COD) %>% #添加空缺列 mutate(caseid = NA)五、REAC文献读取合并身手和上述近似,只肤浅贴一下文献有变化的设施1、2004Q1~2012Q3for (i in 1:length(reac_names)) { temp <- reac_newdata[[i]] %>% rename(primaryid = ISR, pt = PT) %>% mutate(caseid = NA)2、2014Q3~2023Q3for (i in 1:length(reac_names)) { temp <- reac_newdata[[i]] %>% select(primaryid, caseid, pt)六、THER文献读取合并身手和上述近似,只肤浅贴一下文献有变化的设施1、2004Q1~2012Q3for (i in 1:length(ther_names)) { temp <- ther_newdata[[i]] %>% select(ISR, DRUG_SEQ, START_DT) %>% rename(primaryid = ISR, drug_seq = DRUG_SEQ, start_dt = START_DT) %>% mutate(caseid = NA)2、2012Q4~2023Q3for (i in 1:length(ther_names)) { temp <- ther_newdata[[i]] %>% select(primaryid, caseid, dsg_drug_seq, start_dt) %>% rename(drug_seq = dsg_drug_seq)7、RPSR我不需要这个表格信息,就没处分,要是需要,不错按照上述身手进行处分,背面的处分也莫得这个表格,不再赘述。8、DELETED这个表格比拟肤浅,径直合并即可。 本站仅提供存储处事,系数本色均由用户发布,如发现存害或侵权本色,请点击举报。 丝袜控

上一篇:樱井莉亚电影 迈克·约翰逊成功连任好意思国国会众议院议长
下一篇:丝袜美腿 亚洲色图 车长4米9,17.59万降到12.35万,标配1.5T+9AT,至心满满