보고서 제목: CHTKC : 잠금없는 체인 해시 테이블을 기반으로 한 강력하고 효율적인 k-mer 카운팅 알고리즘
보고서 시간:2020年11月10day (주二)下午16:00
보고서위치:학교 본부 컴퓨터 건물313
보고서 요약:DNA 서열에서 길이 k의 각 기판 발생 빈도를 계산하는 것은 게놈 어셈블리, 오차 보정 및 서열 정렬을 포함한 많은 생물 정보학 응용 분야에서 일반적인 작업이다. 문제는 간단하고 시퀀싱 깊이 또는 큰 게놈 크기를 가진 데이터 세트의 효율적인 계산은 어려운 일입니다. 우리는 링크 된 목록을 사용하여 충돌을 해결하는 잠금없는 해시 테이블로 K-mer 카운팅 문제를 해결하기 위해 강력하고 효율적인 방법 인 CHTKC를 제안합니다. 또한 메모리 사용량을 최적화하고 메모리가 모든 K-MER를 수용하기에 충분하지 않은 상황을 처리하기위한 새로운 메커니즘을 설계합니다. CHTKC는 여러 메모리 사용 시나리오에서 7 개의 데이터 세트에서 철저히 테스트되었으며 Jellyfish2 및 KMC3과 비교했습니다. 우리의 연구는 해시 테이블 기반 방법을 사용하여 K-Mer 카운팅 문제를 효과적으로 해결하는 데 가능한 솔루션이 여전히 남아 있음을 보여줍니다.
스피커의 프로필: Wang Guohua, Dean, Northeast Forestry 퍼스트 카지노의 정보 및 컴퓨터 공학 학교 교수 및 박사 과정 감독관.20092018 년 그는 Harbin Institute of Technology로부터 컴퓨터 응용 기술 박사 학위를 받았습니다.20092008 년부터 그는 Harbin Institute of Technology의 컴퓨터 과학 기술 학교의 부퍼스트 카지노, 퍼스트 카지노 및 박사 과정 감독관으로 재직했습니다.20192018 년, Northeast Forestry 퍼스트 카지노의 정보 및 컴퓨터 엔지니어링 학교로 전학하여 Dean, Forestry의 주요 실험실 유전자 육종pi。2013Johns Hopkins 퍼스트 카지노의 박사후 연구원 인 교육부의 "New Century Extresting Talent Support Program"에 입학했습니다. 중국 컴퓨터 소사이어티의 생물 정보학위원회 위원 및 인공 지능 학회의 생물 정보학 및 인공 생활위원회 위원. 주요 연구 방향은 생물 정보학 및 인공 지능입니다. 정하다BMC Genomics저널 편집위원회, 이미자연 프로토콜,Nature Review Genetics,핵산 연구,Bioinformatics및 기타 저널이 게시Sci국제 저널 논문 검색50Sutra. 담당자로서2품목 국가863,4중국 국립 자연 과학 재단 프로젝트.2018Year,201913 번째 5 년 계획의 "디지털 진단 및 치료 장비 R & D"의 주요 특별 회의에 대한 평가 전문가.