Documents

分子選択文のリファレンス

QScript中では,se★と★*1 で挟まれた文字列は分子の選択式であるとして解釈されます(ただし左側と右側の★は同じ文字).

また,GUIの中にも,分子の選択文を入力する場面があります. この場合は,se★と★等は不要で,選択文の内容自体を入力します.

se/chain A and resn ALA/
se/B.100:120.C,N,O,CA/

選択文は選択式からなっており, 選択式選択リテラル選択演算子から構成されています.

一方,選択リテラルの一部のものは 名前リスト数値リスト等を含んでいます. ここでは,これら個々の要素について説明します.

名前リスト

"name" [, "name", ...]

名前リストは"name"あるいは"name"をカンマで区切ったリストからなる. "name"は,アルファベット,数字,アンダースコア(_)からなる文字列である.

数値リスト

"range" [, "range", ...]
"range" := "number" | "number1":"number2"

数値リストは"range"あるいは"range"をカンマで区切ったリストからなる. さらに,"range"は単独の整数値("number")あるいは 二つの整数値"number1":"number2"からなる. 後者は,"number1"以上"number2"以下の整数の範囲を表している.

1, 3:10, 51

上記は1,3,4,...,9,10,51の整数値の集合をあらわす.


選択リテラル

選択リテラルには, いろいろある.

全選択

all
 *

分子中の原子すべての選択を表す.

空選択

none

空の選択集合を表す.

元素による選択

elem [名前リスト]
e; [名前リスト]

[名前リスト]で示される元素名を持つ原子すべてが選択される.

e; C,N,O

分子中の炭素,窒素,酸素原子が選択される.

原子名による選択

name [名前リスト]
n; [名前リスト]

[名前リスト]で示される原子名を持つ原子すべてが選択される.

n; CA,N,O

分子中の,CA, N, Oという原子名を持つ原子すべてが選択される. 通常は,蛋白の主鎖α位炭素,アミド窒素,カルボニル酸素原子である.

残基名による選択

resn [名前リスト]
r; [名前リスト]

[名前リスト]で示される残基名を持つ残基中の原子すべてが選択される.

r; ARG,LYS

分子中のARG(アルギニン)とLYS(リジン)残基が選択される.

残基番号による選択

resn [数値リスト]
i; [数値リスト]

[数値リスト]で示される残基番号を持つ残基中の原子すべてが選択される.

i; 3,5,10:20

残基番号3,5,10〜20をもつ残基がすべて選択される.

残基プロパティーによる選択

rprop [名前1]=[名前2]

[名前1]で示される残基プロパティーが, [名前2]で示される値である残基中の原子すべてが選択される.

rprop secondary=helix

残基プロパティー「secondary」が「helix」である残基中の 全原子が選択される.

チェイン名による選択

chain [名前リスト]
c; [名前リスト]

[名前リスト]で示される名前を持つチェイン中の全原子が選択される.

c; A,B

チェインAとBが選択される.

温度因子による選択

bfac "comp_op" "number"
"comp_op" := "<"|">"|"="

"comp_op"と"number"で指定した値の温度因子を持つ原子が選択される. "number"は実数値である.

bfac>50.0

温度因子が50より大きい原子が選択される.

占有率による選択

occ "comp_op" "number"
"comp_op" := "<"|">"|"="

"comp_op"と"number"で指定した値の占有率を持つ原子が選択される. "number"は実数値である.

occ>0.5

占有率が0.5より大きい原子が選択される.

階層表記(hierarchcal notation)

"chain_names"."resid_nums"."atom_names"
"chain_names" := [名前リスト1] | "*"
"resid_nums" := [数値リスト] | "*"
"atom_names" := [名前リスト2] | "*"

[名前リスト1]で示される名前を持つチェイン中の, [数値リスト]の範囲の残基の, [名前リスト2]の原子名を持つ原子が選択される. "*"を指定した場合は,すべてのチェイン/残基/原子が選択対象になる.

この表記法は

chain "chain_names" and resid "resid_nums" and name "atom_names"

と等価である.

A.1:100.CA,CB

チェインAの残基番号1〜100の,α・β位炭素が選択される.

 *.5,6,7.*

全チェインの残基番号5,6,7の残基中の全原子が選択される. すなわち,

resid 5,6,7

と等価である.


選択演算子

選択演算子には,AND演算子,OR演算子,NOT演算子,AROUND演算子,BYRES演算子があります.

AND演算子

[式1] and [式2]
[式1] & [式2]

式1と式2であらわされる選択集合の積集合からなる選択集合を作成する.

chain A and resn ALA

分子中の,チェインAに属するALA残基のみが選択される.

OR演算子

[式1] or [式2]
[式1] | [式2]

式1と式2であらわされる選択集合の和集合からなる選択集合を作成する.

chain A or resn ALA

分子中のチェインA全体と,すべてのALA残基が選択される.

NOT演算子

not [式1]
! [式1]

式1であらわされる選択集合の補集合からなる選択集合を作成する.

not resn ALA

分子中のALA残基以外すべてが選択される.

AROUND演算子

[式1] around [実数値]

[式1]であらわされる選択集合から[実数値]Å以内にある原子の集合からなる 選択集合を返す. [式1]自体の選択集合は含まれない点に注意.

chain A around 3.5

チェインAから3.5Å以内にある原子の集合が選択される. チェインA自体は選択されない.

BYRES演算子

byres [式1]

[式1]の選択集合が残基単位に拡張される.

byres name SD

原子名SDを持つ原子の集合が,残基単位の選択に拡張される. 蛋白の場合,結果として,メチオニン(Met)残基がすべて選択されることになる.


*1 ★は空白文字, 数字,アルファベット以外の任意の文字

Last-modified: Sun, 07 Aug 2005 00:06:06 JST (5920d)