需求:
aaseqs | targeting_score | possibility_score | targeting_specificity | possibility_specificity |
说明:生成的氨基酸序列 | 靶向性模型分数 | 产量模型分数 | 是否被靶向模型推理 | 是否被活性模型所推理 |
MMQIEFIKOGSMNFRFIPVLFPNAKKEHVP | 0.9915 | 0.9911 | 0 | 0 |
EMQIEFIKOGSMNFRFIPVLFPNAKKEHVE | 0.9913 | 0.9901 | 0 | 0 |
AMQIEFIKOGSMNFRFIPVLFPNAKKEHVD | 0.9911 | 0.9891 | 0 | 0 |
MMQIEFFIKOGSMNFRFIPVLFPNAKKEHVP | 0.9909 | 0.9881 | 0 | 0 |
EMQIEFIKOGSsMNFRFIPVLFPNAKKEHVE | 0.9907 | 0.9871 | 0 | 0 |
AMQIEFIKOGSMNFRFIPpVLFPNAKKEHVD | 0.9905 | 0.9861 | 0 | 0 |
1、可能3小时产生一亿条不同的序列数据,这个时候该用什么时候的数据库???
2、?
1.? 生成器以生产者模式生成大量待推理序列片段
2.? ?
现有数据库积累了一年的数据,查询越来越慢,IT陈家宇给的操作是 把每天插入的数据表做成分区表。
分区表的概念是,一般 按照 CREATION_DATE ,建立分区表,因为一般查询 按照 创建时间去查询是普遍现象。
数据库里,一般一个表就是一个文件,所以不分区, 这个文件会越来越大。
分区表的意思,表还是这个表,如果你分区是按照一天去建立分区表,那就是一天的数据是一个文件,这样我查询,不需要在整张几个GB在大文件里去找一遍,只在当天的文件里去找,这样速度会快很多。
后续会写个事件,event,每天先建立明天的分区表,备份昨天的分区表,删除30天以前的分区表
?