1775084644
2026-04-01 00:00:00

  • Altschul, SF、Gish, W.、Miller, W.、Myers, EW & Lipman, DJ 基本的なローカル アライメント検索ツール。 J.Mol.バイオル。 215、403–410 (1990)。

    論文 CAS PubMed Google Scholar

  • Altschul、SF et al. Gapped BLAST および PSI-BLAST: 新世代のタンパク質データベース検索プログラム。 核酸研究所 25、3389–3402 (1997)。

    論文 CAS PubMed PubMed Central Google Scholar

  • Pearson, WR FASTA プログラムを使用してタンパク質および DNA 配列データベースを検索します。 方法 Mol.バイオル。 24、307–331 (1994)。

    CAS PubMed Google Scholar

  • ヤン、J.-M. & タン、C.-H.タンパク質構造データベースの検索と進化的分類。 核酸研究所 34、3646–3659 (2006)。

    論文 CAS PubMed PubMed Central Google Scholar

  • 王 S. & 鄭 W.-M. CLePAPS: 立体構造文字に基づくタンパク質構造の高速ペアアライメント。 J.Bioinform.計算します。バイオル。 6、347–366 (2008)。

    論文 CAS PubMed Google Scholar

  • ヴァン・ケンペン、M. 他Foldseek を使用した高速かつ正確なタンパク質構造検索。 ナット。バイオテクノロジー。 42、243–246 (2024)。

    論文 PubMed Google Scholar

  • インディアナ州シンディヤロフ & PE ボーン 最適パスの増分組み合わせ拡張 (CE) によるタンパク質構造のアライメント。 タンパク質工学 11、739–747 (1998)。

    論文 CAS PubMed Google Scholar

  • Holm, L. Dali サーバー: タンパク質ファミリーの構造的統一。 核酸研究所 50、W210–W215 (2022)。

    論文 CAS PubMed PubMed Central Google Scholar

  • Zhang, Y. & Skolnick, J. TM-align: TM スコアに基づくタンパク質構造アラインメント アルゴリズム。 核酸研究所 33、2302–2309 (2005)。

    論文 CAS PubMed PubMed Central Google Scholar

  • リチャードソン、L.ら。 MGnify: 2023 年のマイクロバイオーム配列データ分析リソース。 核酸研究所 51、D753–D759 (2023)。

    論文 CAS PubMed PubMed Central Google Scholar

  • Jing, Z.、Su, Y.、Han, Y. 大規模な言語モデルがベクトル データベースと出会うとき: 調査。でプレプリント arXiv (2024年)。

  • Winnicki, MJ、Brown, CA、Porter, HL、Giles, CB & Wren, JD BioVDB: ハイスループット遺伝子発現メタアナリシスのための生物学的ベクター データベース。 フロント。アーティフ。知性。応用 7、1366273 (2024)。

    記事 Google Scholar

  • Hamamsy、T. et al.深層学習を使用したタンパク質のリモート相同性検出と構造アラインメント。 ナット。バイオテクノロジー。 42、975–985 (2023)。

    論文 PubMed PubMed Central Google Scholar

  • リュー、W.ら。 PLMSearch: タンパク質言語モデルは、リモート相同性の正確かつ高速な配列検索を強化します。 ナット。一般。 15、2775 (2024)。

    論文 CAS PubMed PubMed Central Google Scholar

  • ホン、L.ら。ディープデンス検索を使用した、タンパク質ホモログの高速かつ高感度の検出。 ナット。バイオテクノロジー。 43、983–995 (2024)。

    記事 PubMed PubMed Central Google Scholar

  • Verkuil、R. et al.言語モデルは、天然のタンパク質を超えて一般化されます。でプレプリント バイオRxiv https://doi.org/10.1101/2022.12.21.521521 (2022)。

  • Gu, A. & Dao, T. MAMBA: 選択的な状態空間を使用した線形時間シーケンス モデリング。プレプリントは https://arxiv.org/abs/2312.00752 (2023) にあります。

  • シフ、Y.ら。 Caduceus: 双方向等変長距離 DNA 配列モデリング。 手順マッハ。学ぶ。解像度 235、43632 (2024)。

    PubMed PubMed Central Google Scholar

  • Jégou, H.、Douze, M.、および Schmid, C. 最近傍検索のための積量子化。 IEEEトランス。パターンアナル。マッハ。知性。 33、117–128 (2011)。

    論文 PubMed Google Scholar

  • Malkov, YA & Yashunin, DA 階層的なナビゲート可能なスモールワールド グラフを使用した、効率的かつ堅牢な近似最近傍検索。 IEEEトランス。パターンアナル。マッハ。知性。 42、824–836 (2020)。

    論文 PubMed Google Scholar

  • Ahmad, T.、Ahmed, N.、Peltenburg, J. & Al-Ars, Z. ArrowSAM: Apache Arrow を使用したインメモリ ゲノミクス データ処理2020 第 3 回コンピュータ アプリケーションと情報セキュリティに関する国際会議 (ICCAIS) 1–6 (IEEE、2020)。

  • Sanderson, T.、Bileschi, ML、Belanger, D. & Colwell, LJ ProteInfer、タンパク質機能推論のためのディープ ニューラル ネットワーク。 eライフ 12、e80942 (2023)。

    論文 CAS PubMed PubMed Central Google Scholar

  • Wood, DE、Lu, J. & Langmead, B. Kraken 2 によるメタゲノム解析の改善。 ゲノムバイオル。 20、257(2019)。

    論文 CAS PubMed PubMed Central Google Scholar

  • Huson, DH、Auch, AF、Qi, J. & Schuster, SC メタゲノム データの MEGAN 分析。 ゲノム研究所 17、377–386 (2007)。

    論文 CAS PubMed PubMed Central Google Scholar

  • Durairaj、J. et al.天然タンパク質の世界における新しいファミリーとフォールドを明らかにします。 自然 622、646–653 (2023)。

    論文 CAS PubMed PubMed Central Google Scholar

  • Muhammed, MT & Aki-Yalcin, E. 創薬における相同性モデリング: 概要、現在の応用、および将来の展望。 化学。バイオル。薬物の研究 93、12–20 (2019)。

    論文 CAS PubMed Google Scholar

  • UniProtコンソーシアム。ユニバーサルタンパク質リソース (UniProt)。 核酸研究所 36、D190–D195 (2008)。

    記事 Google Scholar

  • Suzek, BE、Huang, H.、McGarvey, P.、Mazumder, R. & Wu, CH UniRef: 包括的で非冗長な UniProt 参照クラスター。 バイオインフォマティクス 23、1282–1288 (2007)。

    論文 CAS PubMed Google Scholar

  • Bairoch, A. & Apweiler, R. SWISS-PROT タンパク質配列データベースとその補足 TrEMBL (2000 年)。 核酸研究所 28、45–48 (2000)。

    論文 CAS PubMed PubMed Central Google Scholar

  • O’Leary、NA et al. NCBI の参照配列 (RefSeq) データベース: 現在のステータス、分類学的拡張、および機能注釈。 核酸研究所 44、D733–D745 (2016)。

    論文 PubMed Google Scholar

  • Chandonia, J.-M.、Fox, NK & Brenner, SE SCOPe: タンパク質拡張データベースの構造分類における大きな高分子構造の分類。 核酸研究所 47、D475–D481 (2019)。

    論文 CAS PubMed PubMed Central Google Scholar

  • Mock, F.、Kretschmer, F.、Kriese, A.、Böcker, S. & Marz, M. ディープ ニューラル ネットワークを使用した、配列類似性を超えた DNA 配列の分類学的分類。 手順国立アカデミー。科学。アメリカ合衆国 119、e2122636119 (2022)。

    論文 CAS PubMed PubMed Central Google Scholar

  • エルナガー、A.ら。 Ankh ☥: 最適化されたタンパク質言語モデルにより、汎用モデリングが可能になります。でプレプリント バイオRxiv https://doi.org/10.1101/2023.01.16.524265 (2023)。

  • Maćkiewicz, A. & Ratajczak, W. 主成分分析 (PCA)。 計算します。地理学。 19、303–342 (1993)。

  • McInnes, L.、Healy, J. & Astels, S. HDBSCAN: 階層密度ベースのクラスタリング。 J. オープンソース ソフトウェア。 2、205 (2017)。

    記事 Google Scholar

  • #ERASTによるスケーラブルな相同性検出

    Leave a Reply

    Your email address will not be published. Required fields are marked *

    This site uses Akismet to reduce spam. Learn how your comment data is processed.