内容説明
近年さまざまな領域で用いられているゲノム配列情報解析についての入門書。特色として,必要となる生物学の知識とプログラミングの技術を同時に記載したほか,プログラミング言語Pythonや基礎的な数学の解説も設けた。
目次
1. 文字とコンピューター
1.1 コンピューターの仕組み
1.1.1 ハードウエア
1.1.2 ソフトウエア
1.2コンピューターにおける文字と符号化
1.2.1 ビット列と数値
1.2.2 文字と符号化
1.2.3 文字フォント
1.2.4 制御文字
1.3 圧縮とハッシュ
1.3.1 符号化を利用した圧縮
1.3.2 圧縮の効率と情報量
1.3.3 ハッシュ法の利用
1.3.4 ハッシュ法の注意点
1.4 Pythonの利用
1.4.1 DNA,RNA,およびアミノ酸配列のデータベースとアクセッション番号
1.4.2 配列データベースへのアクセス
1.5 計算量の評価
1.5.1 ランダウの記法
1.5.2 文字列探索
章末問題
2. ゲノム配列決定とDNA
2.1 DNAの性質
2.1.1 核酸塩基
2.1.2 糖・リン酸バックボーン
2.1.3 ワトソン・クリック塩基対
2.1.4 二本鎖DNA
2.2 複製
2.2.1 DNAの半保存的複製
2.2.2 岡崎フラグメントとDNA複製の限界
2.2.3 PCR
2.2.4 PCR検査
2.3 配列決定
2.3.1 電気泳動法
2.3.2 サザンブロッティング
2.3.3 制限酵素
2.3.4 マイクロアレイ法
2.3.5 第一世代シークエンサー
2.3.6 第二世代(次世代)シークエンサー
2.3.7 第三世代シークエンサー
2.4 k-mer法
2.4.1 k-merの例
2.4.2 k-merのメモリー使用量
2.4.3 ゲノム中に一度しか現れない単語
2.4.4 ゲノムサイズ推定
2.5 デノボアセンブリ
2.5.1 デブラングラフ
2.5.2 順序
2.5.3 橋検出とlowlink
2.5.4 フラーリーのアルゴリズム
2.5.5 デノボアセンブリソフトウエアの例
2.5.6 オーバーラップレイアウトコンセンサス法
2.6 マッピング
2.6.1 巡回ソートとバロウズ・ウィーラー変換
2.6.2 FMインデックスとLFマッピング
2.6.3 FMインデックスを用いた逆バロウズ・ウィーラー変換
2.6.4 FMインデックスを用いた文字列検索
2.6.5 接尾辞配列
2.6.6 接尾辞配列の工夫
2.6.7 マッピングソフトウエアの例
2.6.8 ヒトゲノム参照配列
2.6.9 バロウズ・ウィーラー変換を利用した圧縮
2.7 染色体
2.7.1 セントロメア
2.7.2 体細胞分裂と染色体
2.7.3 減数分裂・性・遺伝的組換え
2.7.4 突然変異
2.7.5 シンテニーと遺伝子重複
2.7.6 エピゲノムとDNAメチル化
2.8 転写とRNA
2.8.1 RNAを構成する要素
2.8.2 転写
2.8.3 スプライシング
2.8.4 エクソンとイントロン
2.8.5 ノーザンブロッティング
2.8.6 テロメアと逆転写酵素
2.8.7 ウイルス
2.8.8 RNA-Seq
章末問題
3. ペアワイズアラインメント
3.1 最適化問題としてのペアワイズアラインメント推定
3.1.1 分子進化
3.1.2 目的関数と最適化問題
3.2 DNA間のスコア
3.3 アミノ酸間のスコア
3.3.1 アミノ酸の構造
3.3.2 タンパク質を構成するアミノ酸
3.3.3 タンパク質を構成するアミノ酸の特性
3.3.4 アミノ酸変異の表記
3.3.5 アミノ酸ペアにスコアを与える方法
3.3.6 BLOSUMスコア
3.4 最適化問題とその難しさ
3.5 動的計画法
3.5.1 動的計画法とニードルマン-ヴンシュ(1970)のアルゴリズム
3.5.2 アフィンギャップスコア
3.5.3 後藤(1982)のアルゴリズム
3.6 加藤ら(2002)のアルゴリズムとMAFFT
3.6.1 連続化と正規分布
3.6.2 ずれと相互相関関数
3.6.3 DNA配列およびアミノ酸配列の2次元ベクトル化
3.6.4 高速フーリエ変換(FFT)と相互相関関数
3.6.5 相互相関関数のピークと相同性
3.6.6 場所の確認
3.6.7 動的計画法1回目
3.6.8 動的計画法2回目
3.7 Biopythonによるアラインメントアプリケーションの呼び出し
3.7.1 BiopythonからのMAFFT呼び出し
3.7.2 BiopythonからのClustal W呼び出し
章末問題
4. 分子系統樹推定と多重配列アラインメント
4.1 進化距離と進化速度
4.1.1 置換
4.1.2 確率過程
4.1.3 ポアソン距離
4.1.4 DNA配列から求める進化距離
4.1.5 DNAにおける遷移速度行列と塩基置換速度の推定
4.1.6 DNA配列比較による進化距離推定の今後の発展
4.1.7 翻訳のプロセスとコドン表
4.1.8 アミノ酸配列から求める進化距離
4.1.9 アミノ酸配列比較による進化距離推定の今後の発展
4.1.10 k-mer法を利用したアラインメントに頼らない進化距離推定法
4.2 進化距離推定をもとにした分子系統樹再構築法
4.2.1 距離行列
4.2.2 Pythonによる系統樹の表示
4.2.3 非加重結合法(UPGMA)
4.2.4 近隣結合法(NJ法)
4.2.5 非加重結合法と近隣結合法の比較
4.2.6 距離行列とgenotype value decomposition
4.2.7 長枝誘引
4.2.8 結合したOTUと残りのOTUの間の距離
4.2.9 ブートストラップ検定
4.2.10 PartTree法
4.2.11 配列数と計算時間の関係
4.2.12 分類群の利用
4.2.13 オーソロガスとパラロガス
4.2.14 真核生物の細胞と細胞内共生説
4.2.15 ミトコンドリアのコドン表
4.3 多重配列アラインメント
4.3.1 逐次追加法
4.3.2 ガイド樹法
4.3.3 外部からの系統樹読み込み
4.3.4 反復改善法
章末問題
5. 機能解析と相同性検索
5.1 統計的仮説検定
5.1.1 実験計画法
5.1.2 超幾何分布
5.1.3 帰無仮説と第1種の過誤
5.1.4 フィッシャーの正確確率検定
5.1.5 Z検定
5.1.6 カイ2乗検定
5.1.7 対立仮説と第2種の過誤
5.2 ゲノムワイド関連解析による疾患関連遺伝子の探索
5.2.1 ゲノムワイド関連解析
5.2.2 ファミリーワイズエラー率とボンフェローニの補正
5.2.3 GWASカタログ
5.3 相同性検索
5.3.1 スミス-ウォーターマン(1981)のアルゴリズム
5.3.2 相同性検索とセグメントスコア
5.3.3 相同性検索の統計検定
5.3.4 BLAST
5.3.5 相同性のある配列が見つからない場合
5.4 アノテーション
5.5 ゲノム配列の変化とタンパク質の機能の関係についての今後の展開
章末問題
付録
A.1 Pythonの基本文法
A.1.1 Pythonのデータ型
A.1.2 Pythonとオブジェクト指向プログラミング
A.1.3 Pythonの構文
A.2 ファイルフォーマット
A.2.1 FASTAフォーマット
A.2.2 FASTQフォーマット
A.3 ベクトルと行列
A.3.1 ベクトルの成分表示
A.3.2 ベクトルの和
A.3.3 ベクトルの大きさ
A.3.4 ベクトルの内積
A.3.5 ベクトルの内積の成分計算
A.3.6 直交
A.3.7 行列
A.3.8 行列の積
A.3.9 2次元のベクトルと面積と行列式
A.4 解析関数
A.4.1 微分とベルヌーイの不等式
A.4.2 指数関数
A.4.3 対数関数と自然対数の底e
A.4.4 三角関数と円周率π
A.5 統計にかかわる関数
A.5.1 標本
A.5.2 同時確率と条件つき確率
A.5.3 確率密度関数
A.5.4 累積分布関数
A.5.5 確率変数の期待値
A.5.6 分散
A.5.7 k次のモーメント
A.5.8 標本平均
A.5.9 標本分散
A.5.10 極値分布
A.5.11 フーリエ変換,畳み込み,相互相関関数
A.5.12 中心極限定理
引用・参考文献
章末問題解答
索引
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
株式会社 コロナ社
-
- 電子書籍
- ヤマケイ文庫 登山史の森へ 山と溪谷社