<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	xmlns:georss="http://www.georss.org/georss" xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#" xmlns:media="http://search.yahoo.com/mrss/"
	>

<channel>
	<title>demonstrate 的 blog</title>
	<atom:link href="http://remonstrate.wordpress.com/feed/" rel="self" type="application/rss+xml" />
	<link>http://remonstrate.wordpress.com</link>
	<description>daily blog</description>
	<lastBuildDate>Tue, 31 Jan 2012 10:29:16 +0000</lastBuildDate>
	<language>zh-sg</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.com/</generator>
<cloud domain='remonstrate.wordpress.com' port='80' path='/?rsscloud=notify' registerProcedure='' protocol='http-post' />
<image>
		<url>http://s2.wp.com/i/buttonw-com.png</url>
		<title>demonstrate 的 blog</title>
		<link>http://remonstrate.wordpress.com</link>
	</image>
	<atom:link rel="search" type="application/opensearchdescription+xml" href="http://remonstrate.wordpress.com/osd.xml" title="demonstrate 的 blog" />
	<atom:link rel='hub' href='http://remonstrate.wordpress.com/?pushpress=hub'/>
		<item>
		<title>suffix tree 的应用（初级篇）</title>
		<link>http://remonstrate.wordpress.com/2012/01/31/suffix-tree-%e7%9a%84%e5%ba%94%e7%94%a8%ef%bc%88%e5%88%9d%e7%ba%a7%e7%af%87%ef%bc%89/</link>
		<comments>http://remonstrate.wordpress.com/2012/01/31/suffix-tree-%e7%9a%84%e5%ba%94%e7%94%a8%ef%bc%88%e5%88%9d%e7%ba%a7%e7%af%87%ef%bc%89/#comments</comments>
		<pubDate>Tue, 31 Jan 2012 10:29:10 +0000</pubDate>
		<dc:creator>zt</dc:creator>
				<category><![CDATA[algorithm]]></category>
		<category><![CDATA[exact set matching]]></category>
		<category><![CDATA[exact string matching]]></category>
		<category><![CDATA[longest common substring]]></category>
		<category><![CDATA[matching statistics]]></category>
		<category><![CDATA[maximal pairs]]></category>
		<category><![CDATA[substring problem]]></category>
		<category><![CDATA[suffix array]]></category>
		<category><![CDATA[suffix tree]]></category>
		<category><![CDATA[suffix-prefix matching]]></category>
		<category><![CDATA[Ziv-Lampel compression]]></category>

		<guid isPermaLink="false">http://remonstrate.wordpress.com/?p=4893</guid>
		<description><![CDATA[前面简单的提到了 suffix tree 的基本用途，在给定字符串中进行快速搜索。但这仅仅是最基本的一个应用。 Exact set matching 前面提到过的 Aho-Corasick algorithm（是 KMP 的推广）为求解这个问题提供了一种思路，实际上· suffix tree 同样可以求解这个问题，并且我们只需要使用 exact string matching 策略遍历给定集合里面的每个字符串就行了。 两者的时间渐进复杂度是相当的，但是两种策略各有优缺点：如果 P(attern) 大于 T(ext)，尽管占用的空间比较小，但是搜索比较慢；如果 P 小于 T，则 Aho-Corasick 算法尽管占用空间小，但却搜索较慢。这就需要我们 trade-off 时间和空间。有一点 suffix tree 在固定的语料集合上有优势的是只需要建立一次 suffix tree 后面可以重复使用。从 KMP 的思路也可以看出来，KMP 系的做法是预处理 pattern，而 suffix tree 是预处理 text。 Substring problem 这个问题与 bioinfo 里面检索某些 DNA 序列比较像，但是对于 DNA sequence 一般只能用 inexact [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4893&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>前面简单的提到了 suffix tree 的基本用途，在给定字符串中进行快速搜索。但这仅仅是最基本的一个应用。</p>
<p><strong>Exact set matching</strong></p>
<p>前面提到过的 Aho-Corasick algorithm（是 KMP 的推广）为求解这个问题提供了一种思路，实际上· suffix tree 同样可以求解这个问题，并且我们只需要使用 exact string matching 策略遍历给定集合里面的每个字符串就行了。</p>
<p>两者的时间渐进复杂度是相当的，但是两种策略各有优缺点：如果 P(attern) 大于 T(ext)，尽管占用的空间比较小，但是搜索比较慢；如果 P 小于 T，则 Aho-Corasick 算法尽管占用空间小，但却搜索较慢。这就需要我们 trade-off 时间和空间。有一点 suffix tree 在固定的语料集合上有优势的是只需要建立一次 suffix tree 后面可以重复使用。从 KMP 的思路也可以看出来，KMP 系的做法是预处理 pattern，而 suffix tree 是预处理 text。</p>
<p><strong>Substring problem</strong></p>
<p>这个问题与 bioinfo 里面检索某些 DNA 序列比较像，但是对于 DNA sequence 一般只能用 inexact match，这里是一个简化的版本。即有一个 database，里面存放有若干字符串，现给定一个字符串，如何获得含有这个字符串的集合（可以是空集）。Suffix tree 对这类问题基本是门当户对。</p>
<p><strong>Longest common substring</strong></p>
<p>所谓 longest common substring 与 longest common subsequence 的区别是前者要求找到的是连续的（所以是个 substring），后者不要求是连续的（所以后者的长度不小于前者）。</p>
<p>一般求解这个问题比较“笨”的方案是做一个 <img src='http://s0.wp.com/latex.php?latex=m+%5Ctimes+n&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='m &#92;times n' title='m &#92;times n' class='latex' /> 的表，里面填两个字符串对应元素是否 match，然后找对角线上连续为匹配最长的位置。后者一般使用 dynamic programming，建立 <img src='http://s0.wp.com/latex.php?latex=m%5Ctimes+n&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='m&#92;times n' title='m&#92;times n' class='latex' /> 的表从前开始填，如果相同 <img src='http://s0.wp.com/latex.php?latex=T%28i%2C+j%29+%3D+T%28i+-+1%2C+j+-+1%29+%2B+1&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='T(i, j) = T(i - 1, j - 1) + 1' title='T(i, j) = T(i - 1, j - 1) + 1' class='latex' />；否则取两种情况的大者 <img src='http://s0.wp.com/latex.php?latex=T%28i%2C+j%29+%3D+%5Cmax+%5C%7B+T%28i+-+1%2C+j%29%2C+T%28i%2C+j+-+1%29%5C%7D&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='T(i, j) = &#92;max &#92;{ T(i - 1, j), T(i, j - 1)&#92;}' title='T(i, j) = &#92;max &#92;{ T(i - 1, j), T(i, j - 1)&#92;}' class='latex' />。通过 suffix tree 可以将这个问题的时间复杂度从 <img src='http://s0.wp.com/latex.php?latex=O%28mn%29&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='O(mn)' title='O(mn)' class='latex' /> 降低到 <img src='http://s0.wp.com/latex.php?latex=O%28m+%2B+n%29&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='O(m + n)' title='O(m + n)' class='latex' />，这需要对 suffix tree 本身进行一定的推广，这时两个字符串的 suffix 都对应于 leaf，如果有共用的 suffix 对应于一个 leaf。这样我们就把原问题转换成为了在这个 tree 上搜两个 string 共用的 path，对应的 string depth 最深，这一般可以通过对 tree 做遍历（线性时间复杂度）获得。</p>
<p><strong>DNA contamination problem</strong></p>
<p>给定两个字符串，其中一个可能是被污染的字符串，另一个是用来污染的字符串，如果前者里面出现了后者里面的字串长度超过了一定的大小就认为被后者污染了。这经常在 DNA 测序里面检验获得的 DNA 序列是否被一些已知的污染 DNA 片段污染，以保证获得的 DNA 序列的纯洁性。</p>
<p>后缀树求解的方法和前者类似，出现 contamination 的是一些 internel node 如果有来自两者的 leaf，这说明两者含有公共的字串，如果 string depth 超过给定值，则说明的确是发现了 contamination。</p>
<p><strong>Common substrings of multiple strings</strong></p>
<p>这是对两个字符串寻找公共子串的推广问题。这个问题的正是描述是，对于 K 个字符串，需要对任意 k 满足大于等于 2 小于等于 K，获得 l(k) 表示至少有 k 个字符串公共的子串中长度的最大值。该问题的最优解是 <img src='http://s0.wp.com/latex.php?latex=O%28n%29&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='O(n)' title='O(n)' class='latex' />，其中 n 是字符串总长度，比较 naieve 的做法可以做到 <img src='http://s0.wp.com/latex.php?latex=O%28Kn%29&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='O(Kn)' title='O(Kn)' class='latex' />。这个方法就是将两个 string 的想法推广，为 internal node 记录 K 个标志位表示被几个字符串包含。</p>
<p><strong>DAG compression</strong></p>
<p>给定一个 suffix tree，如何将其用一个 DAG 表达出来，这个 DAG 是能识别所有 suffix 的最小 FSA。基本的想法就是将 suffix tree 中 share 的子树结构（同构）进行 merge，这样 tree 就变成了 DAG 了。一般意义下的 subtree isomorphism 是相对较难的问题，但是对于 suffix tree 这种特殊的 tree，则要简单许多。可以证明，如果两个 node，其一有到另外一个的 suffix link（即到前者的 prefix 是另一个 prefix 的 suffix），且两者子节点含有相同多的 leaf，则两者对应的子树同构。利用这个结论 top-down 的寻找符合条件的 pair 进行 merge 就能获得需要的 DAG。</p>
<p><strong>Matching statistics</strong></p>
<p>这是反向应用 suffix tree 解决 matching 问题里面的一种核心技术，所谓反向应用 suffix tree 是指，为 pattern 建立 suffix tree 而不是对 text。所谓的 matching statistics（MS）是指 <img src='http://s0.wp.com/latex.php?latex=%5Ctext%7BMS%7D+%28i%29&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='&#92;text{MS} (i)' title='&#92;text{MS} (i)' class='latex' /> 对应 text 中第 <img src='http://s0.wp.com/latex.php?latex=i&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='i' title='i' class='latex' /> 个字符开始与 pattern 某子串匹配上的最长的子串长度。比较简单的应用 P 的 suffix tree，然后遍历 T 的每个字符是不能在 linear time 获得 <img src='http://s0.wp.com/latex.php?latex=%5Ctext%7BMS%7D%28i%29&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='&#92;text{MS}(i)' title='&#92;text{MS}(i)' class='latex' /> 的。核心的观察是计算下一个 <img src='http://s0.wp.com/latex.php?latex=MS%28i+%2B+1%29&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='MS(i + 1)' title='MS(i + 1)' class='latex' /> 时是否能利用前面的结果进行简化，这个窍门据说与 Ukkenon 算法相同。</p>
<p>应用这个思路求解 longest common substring 问题时，我们可以对短的 string 处理获得其 suffix tree 以减少 space 的额外需求。</p>
<p><strong>All-pairs suffix-prefix matching</strong></p>
<p>给定两个字符串，寻找前者的一个后缀与后者的一个前缀的匹配称为 suffix-prefix matching。如果给定 k 个字符串，总长度为 m，找到任意两个之间的 suffix-prefix matching 中最长匹配的问题称为 all-pairs suffix-prefix matching。</p>
<p>利用 suffix tree 求解该问题的思路如下，将所有 string 利用 generalized suffix tree 建立索引，寻找第 j 个字符串对应的 leaf（即完整的第 j 个字符串出现在整个 root path 上），如果这条 path 上存在某个节点 v，且 i 属于 <img src='http://s0.wp.com/latex.php?latex=L%28v%29&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='L(v)' title='L(v)' class='latex' />，即 v 是 internal node 但链接了 terminal edge（即对应 label 是终止符），则 <img src='http://s0.wp.com/latex.php?latex=L%28v%29&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='L(v)' title='L(v)' class='latex' /> 是所有这条 root path 对应的字符串的集合，这样相当于找到了第 i 个字符串的 suffix 正好是第 j 个字符串的 prefix。</p>
<p>这种策略的时间复杂度将会是 <img src='http://s0.wp.com/latex.php?latex=O%28m+%2B+k%5E2%29&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='O(m + k^2)' title='O(m + k^2)' class='latex' />。</p>
<p><strong>Finding maximal pairs</strong></p>
<p>所谓的 maximal pair 指字符串两个不同的子串，它们完全相同，且其对应左右字符均不同，这保证不能在其基础上继续扩大，其中这个重复的字符串（可能有 overlap）称为 maximal repeat。supermaximal repeat 指这样一种 maximal repeat，它不是其他 maximal repeat 的子串。</p>
<p>使用 suffix tree 求解该问题的第一个观察是如果字符串是 maximal repeat，则一定是到某个节点的 root path 对应的子串。长度为 n 的字符串最多也只会有 n 个 maximal repeat。这告诉我们应该在哪里寻找 maximal repeat。第二个观察表明，当且仅当节点 v 是 left diverse 的时候对应的 root path 的子串才是 maximal repeat。所谓 left diverse 指该节点至少有两个 leaf （这对应两个 suffix）对应的 left character（即这个 suffix 前面一个字符）是不同的。因此 leaf 本身不是 left diverse 的。</p>
<p>这样就把寻找 maximal repeat 转换成为寻找 left diverse 的 node，如何紧凑的将 left character 在 suffix tree 中表示出来就可以较好的解决原问题了。我们可以用所谓的 frontier 节点来看待最终的表示，所谓 frontier 指这样的 node，他本身是 left diverse 但其任意子节点都不是 left diverse。这样每个到 frontier 的 root path 就代表一个 maximal repeat 了。比较容易的做法就是从每个 leaf 开始将其 left character 向父节点传递，如果某个父节点获得了两个不同的 left character 就是 frontier，并停止继续向上传递。</p>
<p>如果是想找到 supermaximal repeat，可以使用如下观察：其所有子节点都是 leaf 且对应的 left character 不同。另外有所谓的 near-supermaximal repeat，可以用类似的分析求解。</p>
<p><strong>Circular string linearization</strong></p>
<p>给定一个长度为 n 的 circular string，找到一个开始的地方对应的 linearized string 具有最小的字典序。</p>
<p>求解该问题可以先将字符串随便 linearize 记为 L，然后对 LL 建立 suffix tree，这样遍历 tree 的时候选择首字母最小的直到 string depth 为 n 停止。</p>
<p><strong>Suffix array</strong></p>
<p>前面简单的介绍了 suffix array 比较 naieve 的构造方法。我们可以简单的将长度为 m 的字符串对应的 m 个 suffix 编号为整数，并且将其用对应的顺序排序，这样可以简洁的表达出 suffix array。这样我们建立了 suffix tree 之后通过 lexical depth first 遍历，就能获得这种表示吓得 suffix array，对不少问题来说，直接使用 suffix array 就足够了（效率差不多），suffix tree 本身可以丢弃。这样就可以节省不少内存的开销。</p>
<p>在这种表示下进行 pattern search 我们可以使用 binary search，比较 P 与 suffix array 每个后缀对应的 suffix。因此需要的时间（仅搜索部分）是 <img src='http://s0.wp.com/latex.php?latex=O%28n%5Clog+m%29&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='O(n&#92;log m)' title='O(n&#92;log m)' class='latex' />。事实上有一些 trick 可以用来加速这个搜索，前面说了可以保留与前一个 suffix 公共前缀的长度，利用这个可以加速跳转，这可以 improve 到 <img src='http://s0.wp.com/latex.php?latex=O%28n+%2B+%5Clog+m%29&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='O(n + &#92;log m)' title='O(n + &#92;log m)' class='latex' />。</p>
<p><strong>Ziv-Lempel compression</strong></p>
<p>这个压缩算法的核心思想是如果前面一部分“字符串”表示出来（压缩表示）了，那么后面碰到类似子串时就可以直接“引用”前面的子串。比如标记为前面在哪里出现长度是多少的子串。实现这样一个压缩算法可以利用 suffix tree，比较简单的做法是建立 suffix tree 后，在搜索可替代某处子串的时候要求这个 prefix 出现的 path 里面有小于当前位置的 leaf。为了快速获得是否含有这个 leaf，我们可以为每个顶点加上一个属性，表示通过该节点的 root path 中 leaf 编号最小的是谁。这也是线性时间可以解决的，这样搜索就可以简单的查询这个属性就 ok 了，这样完成压缩是 <img src='http://s0.wp.com/latex.php?latex=O%28m%29&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='O(m)' title='O(m)' class='latex' />。</p>
<p>这样看来使用 suffix tree 需要多次扫描输入，但实际上整个过程可以 one-pass 做掉。</p>
<p><em>&#8212;&#8212;&#8212;&#8212;&#8212;-<br />
Then Lot chose him all the plain of Jordan; and Lot journeyed east: and they separated themselves the one from the other.</em></p>
<br />Filed under: <a href='http://remonstrate.wordpress.com/category/academics/algorithm/'>algorithm</a> Tagged: <a href='http://remonstrate.wordpress.com/tag/exact-set-matching/'>exact set matching</a>, <a href='http://remonstrate.wordpress.com/tag/exact-string-matching/'>exact string matching</a>, <a href='http://remonstrate.wordpress.com/tag/longest-common-substring/'>longest common substring</a>, <a href='http://remonstrate.wordpress.com/tag/matching-statistics/'>matching statistics</a>, <a href='http://remonstrate.wordpress.com/tag/maximal-pairs/'>maximal pairs</a>, <a href='http://remonstrate.wordpress.com/tag/substring-problem/'>substring problem</a>, <a href='http://remonstrate.wordpress.com/tag/suffix-array/'>suffix array</a>, <a href='http://remonstrate.wordpress.com/tag/suffix-tree/'>suffix tree</a>, <a href='http://remonstrate.wordpress.com/tag/suffix-prefix-matching/'>suffix-prefix matching</a>, <a href='http://remonstrate.wordpress.com/tag/ziv-lampel-compression/'>Ziv-Lampel compression</a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/remonstrate.wordpress.com/4893/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/remonstrate.wordpress.com/4893/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/remonstrate.wordpress.com/4893/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/remonstrate.wordpress.com/4893/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/remonstrate.wordpress.com/4893/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/remonstrate.wordpress.com/4893/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/remonstrate.wordpress.com/4893/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/remonstrate.wordpress.com/4893/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/remonstrate.wordpress.com/4893/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/remonstrate.wordpress.com/4893/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/remonstrate.wordpress.com/4893/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/remonstrate.wordpress.com/4893/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/remonstrate.wordpress.com/4893/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/remonstrate.wordpress.com/4893/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4893&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://remonstrate.wordpress.com/2012/01/31/suffix-tree-%e7%9a%84%e5%ba%94%e7%94%a8%ef%bc%88%e5%88%9d%e7%ba%a7%e7%af%87%ef%bc%89/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">zt</media:title>
		</media:content>
	</item>
		<item>
		<title>shot boundary detection 问题</title>
		<link>http://remonstrate.wordpress.com/2012/01/30/shot-boundary-detection-%e9%97%ae%e9%a2%98/</link>
		<comments>http://remonstrate.wordpress.com/2012/01/30/shot-boundary-detection-%e9%97%ae%e9%a2%98/#comments</comments>
		<pubDate>Mon, 30 Jan 2012 06:37:07 +0000</pubDate>
		<dc:creator>zt</dc:creator>
				<category><![CDATA[computer vision]]></category>
		<category><![CDATA[color histogram]]></category>
		<category><![CDATA[edge histogram]]></category>
		<category><![CDATA[shot boundary detection]]></category>

		<guid isPermaLink="false">http://remonstrate.wordpress.com/?p=4558</guid>
		<description><![CDATA[这个问题主要是为了将 video 分解成为一个一个的片段，而后面理解 video 里面的 scene，semantic scene 提供基础。我们知道电影里面常见的所谓“镜头”，long/short shot 对应的就是摄像机不间断工作获得的一段视频（胶片），视频的剪辑（cut）一般就是将这些片段中需要的部分挑出来，然后和前后拼接起来。从视觉效果上，拼接的方式分 hard cut，即不做处理直接连接，也有增加渐变效果，如淡入淡出（fade in/out），溶解（dissolve）。电视节目里面还有通过一个简短的动画跳到慢动作重播，等等。 因为这些边界地方存在“不连续性”，因此获得某些因为不连续而突变的 feature 就是解决这个问题最常见的手段了。对于 hard cut 来说往往场景变化大，最简单的莫过于 color histogram 的变化就可以反应这种突变，因为如果是一个镜头内的变化往往是细小的，当然除了全局 histogram 也有用 region 的。 更难的可能就是 gradual transition，因为这类变化较慢，单单使用 color histogram 并不能获得很好的效果，可能的想法是通过 edge 的变化，由于 dissolve 这种类型会带来模糊（降低了 contrast 和 sharpness），edge histogram 的变化从一定程度上会反应这种变化的发生。但是电影中常用的融镜，大光圈镜头焦点的快速跳转也会导致 edge histogram 的变化。 还有一些题材的视频也会有一些额外 challenging 的地方，比如电视视频里面常见的闪光灯，闪光灯的色温和环境未必完全一样，它的出现会导致 color histogram 的大量变化，引起误判。另外某些产生剧烈运动（如相机或者物体）的时候也有可能出现误判，所以需要一些 motion compensation 的技术避免假阳性。 根据一些 survey，hard [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4558&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>这个问题主要是为了将 video 分解成为一个一个的片段，而后面理解 video 里面的 scene，semantic scene 提供基础。我们知道电影里面常见的所谓“镜头”，long/short shot 对应的就是摄像机不间断工作获得的一段视频（胶片），视频的剪辑（cut）一般就是将这些片段中需要的部分挑出来，然后和前后拼接起来。从视觉效果上，拼接的方式分 hard cut，即不做处理直接连接，也有增加渐变效果，如淡入淡出（fade in/out），溶解（dissolve）。电视节目里面还有通过一个简短的动画跳到慢动作重播，等等。</p>
<p>因为这些边界地方存在“不连续性”，因此获得某些因为不连续而突变的 feature 就是解决这个问题最常见的手段了。对于 hard cut 来说往往场景变化大，最简单的莫过于 color histogram 的变化就可以反应这种突变，因为如果是一个镜头内的变化往往是细小的，当然除了全局 histogram 也有用 region 的。</p>
<p>更难的可能就是 gradual transition，因为这类变化较慢，单单使用 color histogram 并不能获得很好的效果，可能的想法是通过 edge 的变化，由于 dissolve 这种类型会带来模糊（降低了 contrast 和 sharpness），edge histogram 的变化从一定程度上会反应这种变化的发生。但是电影中常用的融镜，大光圈镜头焦点的快速跳转也会导致 edge histogram 的变化。</p>
<p>还有一些题材的视频也会有一些额外 challenging 的地方，比如电视视频里面常见的闪光灯，闪光灯的色温和环境未必完全一样，它的出现会导致 color histogram 的大量变化，引起误判。另外某些产生剧烈运动（如相机或者物体）的时候也有可能出现误判，所以需要一些 motion compensation 的技术避免假阳性。</p>
<p>根据一些 survey，hard cut 的 PR 应该都能做到 90% 以上，而 gradual 应该能做到 70% 以上。</p>
<p>下面我们罗列出来一些有用的 feature，待后面使用：</p>
<ul>
<li>color histogram differences（CHD），这个的变体很多，比如直接用 RGB 还是用 HSV 的 HS channel，还是用 L*a*b，使用的是局部的 histogram 还是全局的，差异用什么度量（<img src='http://s0.wp.com/latex.php?latex=L%5E1&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='L^1' title='L^1' class='latex' /> 还是 <img src='http://s0.wp.com/latex.php?latex=L%5E2&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='L^2' title='L^2' class='latex' />、KL divergence、相关系数）；</li>
<li>edge change ratio（ECR），使用这个 feature，我们可以选择一个 edge detection 算法（如 Canny），这样每帧的 edge pixel 可以标定出来，那么前后两帧进行比较就能获得前一帧不再是 edge 的 pixel 个数 <img src='http://s0.wp.com/latex.php?latex=X_%7Bn+-+1%7D%5E%5Ctext%7Bout%7D&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='X_{n - 1}^&#92;text{out}' title='X_{n - 1}^&#92;text{out}' class='latex' /> 以及后一帧成为 edge 的 pixel 个数 <img src='http://s0.wp.com/latex.php?latex=X_n%5E%5Ctext%7Bin%7D&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='X_n^&#92;text{in}' title='X_n^&#92;text{in}' class='latex' />，这分别与 edge pixel 的总数的比例的较大者就能作为一种 feature：<img src='http://s0.wp.com/latex.php?latex=%5Ctext%7BECR%7D_n+%3D+%5Cmax+%5C%7B+X_n%5E%5Ctext%7Bin%7D+%2F+%5Csigma_n%2C+X_%7Bn+-+1%7D%5E%5Ctext%7Bout%7D+%2F+%5Csigma_%7Bn+-+1%7D%5C%7D&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='&#92;text{ECR}_n = &#92;max &#92;{ X_n^&#92;text{in} / &#92;sigma_n, X_{n - 1}^&#92;text{out} / &#92;sigma_{n - 1}&#92;}' title='&#92;text{ECR}_n = &#92;max &#92;{ X_n^&#92;text{in} / &#92;sigma_n, X_{n - 1}^&#92;text{out} / &#92;sigma_{n - 1}&#92;}' class='latex' />。</li>
<li>灰度标准差（standard deviation of pixel intensities），这衡量了一个场景的“亮度”一致性，在某些 fade in/out 变化中，两者都会导致标准差急剧变小。这个并不是用前后两帧的差来刻画的。</li>
<li>edge-based contrast（EC），这刻画的是 edge 中比较强的 edge 和比较弱的 edge 的比例变化，我们通过两个 threshold 设定决定一个 edge map 中两类 pixel 的多少，分别记为 <img src='http://s0.wp.com/latex.php?latex=s%28K%29&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='s(K)' title='s(K)' class='latex' /> 与 <img src='http://s0.wp.com/latex.php?latex=s%28K%29&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='s(K)' title='s(K)' class='latex' />，其中 <img src='http://s0.wp.com/latex.php?latex=K&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='K' title='K' class='latex' /> 是当前帧，我们定义 <img src='http://s0.wp.com/latex.php?latex=%5Ctext%7BEC%7D%28K_t%29+%3D+1+%2B+%5Cdfrac%7Bs%28K_t%29+-+w%28K_t%29+-+1%7D%7Bs%28K_t%29+%2B+w%28K_t%29+%2B+1%7D&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='&#92;text{EC}(K_t) = 1 + &#92;dfrac{s(K_t) - w(K_t) - 1}{s(K_t) + w(K_t) + 1}' title='&#92;text{EC}(K_t) = 1 + &#92;dfrac{s(K_t) - w(K_t) - 1}{s(K_t) + w(K_t) + 1}' class='latex' />。</li>
</ul>
<p>为了避免在一个片段多次检测出 cut，一般还会设置一个帧数阈值，之内发现的几次 cut 算作一次。除了仅仅考虑相邻两帧以外，也可以将以上 feature 加上时间变成几个时间序列，进行空时分析。这类分析为了避免 fluctuation 一般需要先对数据进行 smoothing（如设定一个 window 做平均），然后根据波峰波谷的位置来确定产生特定效果的位置，前面罗列的 feature 的后两者比较适合这样做。</p>
<p>感觉这个 task 现在还是跟视频本身的性质有较大的关系，anyway 先看看 treckvid 上面都是些啥吧。</p>
<p><em>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;<br />
And Lot lifted up his eyes, and beheld all the plain of Jordan, that it was well watered every where, before the LORD destroyed Sodom and Gomorrah, even as the garden of the LORD, like the land of Egypt, as you come to Zoar.</em></p>
<br />Filed under: <a href='http://remonstrate.wordpress.com/category/academics/computer-vision/'>computer vision</a> Tagged: <a href='http://remonstrate.wordpress.com/tag/color-histogram/'>color histogram</a>, <a href='http://remonstrate.wordpress.com/tag/edge-histogram/'>edge histogram</a>, <a href='http://remonstrate.wordpress.com/tag/shot-boundary-detection/'>shot boundary detection</a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/remonstrate.wordpress.com/4558/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/remonstrate.wordpress.com/4558/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/remonstrate.wordpress.com/4558/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/remonstrate.wordpress.com/4558/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/remonstrate.wordpress.com/4558/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/remonstrate.wordpress.com/4558/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/remonstrate.wordpress.com/4558/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/remonstrate.wordpress.com/4558/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/remonstrate.wordpress.com/4558/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/remonstrate.wordpress.com/4558/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/remonstrate.wordpress.com/4558/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/remonstrate.wordpress.com/4558/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/remonstrate.wordpress.com/4558/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/remonstrate.wordpress.com/4558/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4558&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://remonstrate.wordpress.com/2012/01/30/shot-boundary-detection-%e9%97%ae%e9%a2%98/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">zt</media:title>
		</media:content>
	</item>
		<item>
		<title>Computational Advertising 笔记（七）</title>
		<link>http://remonstrate.wordpress.com/2012/01/30/computational-advertising-%e7%ac%94%e8%ae%b0%ef%bc%88%e4%b8%83%ef%bc%89/</link>
		<comments>http://remonstrate.wordpress.com/2012/01/30/computational-advertising-%e7%ac%94%e8%ae%b0%ef%bc%88%e4%b8%83%ef%bc%89/#comments</comments>
		<pubDate>Mon, 30 Jan 2012 05:06:37 +0000</pubDate>
		<dc:creator>zt</dc:creator>
				<category><![CDATA[readings]]></category>
		<category><![CDATA[computational advertising]]></category>
		<category><![CDATA[non-guaranteed display]]></category>

		<guid isPermaLink="false">http://remonstrate.wordpress.com/?p=4753</guid>
		<description><![CDATA[non-guaranteed display 算是比较不挣钱的业务了。感觉这部分课程讲述的也不是太多，最后谈了一篇文献。 前面谈了一些关于 GD 的事情，这里想稍微探讨一下关于 business model 对 GD 的影响。依照前面的说法 publisher 需要吸引用户，那么什么样的“东西”能够让用户过来呢？早期的互联网公司的代表莫过于 Yahoo!、AOL 等依靠手上的“content”，这些内容大多是文本性质，并加以配图或者视频，基本上沿袭了过去人们生活中看报、看杂志这类型的信息需求。这种 business model 的问题就是用户粘性小，一旦出现了别的替代品，很可能就会损失用户。另外这种模式下用户并不会主动贡献自己的信息，多数用户并不选择登陆。更多的用户可能就不是那么信任 publisher，所填信息很可能是伪造的。这给 GD 投放造成了很多麻烦，advertiser 所提出的用户群体性质必须通过某些手段（利用浏览习惯等方式）推断出来。 而 social network 使用的是人与人之间的 connection，以及满足人偷窥心理、分享心理的内容来吸引用户。在这种情况下，用户在 social network 里面提供的基本上都是真实的内容，这样才能方便与认识的人进行交流。而就算前面那种内容提供了用户交流的可能（如设计 comments），也很难让用户之间建立某种 connection。这种情况下 GD 投放变得非常容易，因为用户相关属性很可能都已经存在，并且多数都是正确的。需要非常多 science 方面工作的事情都省去了。 因此，选择不同的 business model 对今后广告投放的影响将会是非常巨大的。我想每个 advertiser 都很清楚后者投放的准确性将比前者高，因此投放选择的 publisher 这几年的确已知在向后者倾斜。另一方面 business model 也决定了运营的成本，比如前者就需要大量 science 的 effort 保证推断用户属性的精准。 另外一些题外话是广告如何 serve 的。我们知道访问网站的时候服务器发出的 HTTP [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4753&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>non-guaranteed display 算是比较不挣钱的业务了。感觉这部分课程讲述的也不是太多，最后谈了一篇文献。</p>
<p>前面谈了一些关于 GD 的事情，这里想稍微探讨一下关于 business model 对 GD 的影响。依照前面的说法 publisher 需要吸引用户，那么什么样的“东西”能够让用户过来呢？早期的互联网公司的代表莫过于 Yahoo!、AOL 等依靠手上的“content”，这些内容大多是文本性质，并加以配图或者视频，基本上沿袭了过去人们生活中看报、看杂志这类型的信息需求。这种 business model 的问题就是用户粘性小，一旦出现了别的替代品，很可能就会损失用户。另外这种模式下用户并不会主动贡献自己的信息，多数用户并不选择登陆。更多的用户可能就不是那么信任 publisher，所填信息很可能是伪造的。这给 GD 投放造成了很多麻烦，advertiser 所提出的用户群体性质必须通过某些手段（利用浏览习惯等方式）推断出来。</p>
<p>而 social network 使用的是人与人之间的 connection，以及满足人偷窥心理、分享心理的内容来吸引用户。在这种情况下，用户在 social network 里面提供的基本上都是真实的内容，这样才能方便与认识的人进行交流。而就算前面那种内容提供了用户交流的可能（如设计 comments），也很难让用户之间建立某种 connection。这种情况下 GD 投放变得非常容易，因为用户相关属性很可能都已经存在，并且多数都是正确的。需要非常多 science 方面工作的事情都省去了。</p>
<p>因此，选择不同的 business model 对今后广告投放的影响将会是非常巨大的。我想每个 advertiser 都很清楚后者投放的准确性将比前者高，因此投放选择的 publisher 这几年的确已知在向后者倾斜。另一方面 business model 也决定了运营的成本，比如前者就需要大量 science 的 effort 保证推断用户属性的精准。</p>
<p>另外一些题外话是广告如何 serve 的。我们知道访问网站的时候服务器发出的 HTTP header 里面有 Set-Cookie 这类与 cookie 相关的请求，browser 就会将这些需要记录的 key-value pair 保存在 client 端（如果允许的话）。现在多数复杂的网页都不是一个 server 或者 site 进行 serve 的。publisher 会在页面上嵌入某些 javascript（来自 ad network），这些程序就可以在 ad network 的 cookie 中捕获用户浏览 publisher 的行为，从而（在当前页面甚至是其他也使用了该 ad network 的 js 的网站）serve 合适的 ads。</p>
<p>对于 advertiser 选择 GD 或者 NGD 取决于他们是需要 guaranteed 结果还是 opportunistic 的策略，NGD 获得的流量是 GD 卖出的 premium 部分之后剩下的，点击率等将会更低，这也带来了更多的难处。有些研究表明，online ads 有长期的 offline effect。由于 NGD 是 online bid 获得流量，不少 advertiser 可能会寻求一些 agency（intermediates），这跟买房找中介是类似的，各有优缺点。但事实上数据表明似乎寻求 DSP（demand side platforms）的广告投放比例正在增加。</p>
<div id="attachment_4895" class="wp-caption alignnone" style="width: 710px"><a href="http://remonstrate.files.wordpress.com/2012/01/display-ads-ecosys.png"><img class="size-full wp-image-4895" title="展示广告生态系统" src="http://remonstrate.files.wordpress.com/2012/01/display-ads-ecosys.png?w=700&#038;h=440" alt="" width="700" height="440" /></a><p class="wp-caption-text">展示广告生态系统</p></div>
<p>这个生态系统中直接供应 ads 的是所谓的 ad network，其作用是将用户的行为（publisher audience）“翻译”成为 advertiser 需要的属性（advertiser audience），主要是处理一些小的 publisher、intermediates 等的需求。这些 ad network 的收入主要是从交易中提成。这里的 DSP 主要是帮助 advertiser（demand providers）通过一些技术手段实现 RTB（real time bidding）、对不同的 ad network 上的 exchange 有一致的方式，另外还有 budget management 等附加的服务。所谓的 ad agency 一般是提供传统的在线广告形式，如 campaign，他们直接与 publisher 或者 ad network 进行交易。</p>
<p>通常为了更好的将 display ads 传递到用户，也会使用一些 retargeting 策略，利用用户 search、浏览的信息更加精准的投放需要的广告，像不少 ad network，如 google、yahoo 都有这方面的手段将 publisher audience 转换成为 advertiser audience。</p>
<p>最后讲的一个 paper 大致的意思是说进行预测 display ads 的 CTR （或者 conversion probability）的时候常常会碰到数据 granularity 的问题，粒度太小就会数据不足（可能会），太大就会不精准，如何 balance 两者，是不是粒度小了稀疏后就一定要回退到粒度更高的 CTR 作为候选？所谓的粒度，如 publisher hierarchy、geo hierarchy 或者 ad hierarchy 等。paper 给的策略大致就是既然当前 granularity 数据不够就用上层的几个 CTR 与当前的加权。那么这个权值是 learn 出来的。</p>
<p><em>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;<br />
Is not the whole land before you? separate yourself, I pray you, from me: if you will take the left hand, then I will go to the right; or if you depart to the right hand, then I will go to the left.</em></p>
<br />Filed under: <a href='http://remonstrate.wordpress.com/category/entertainment/readings/'>readings</a> Tagged: <a href='http://remonstrate.wordpress.com/tag/computational-advertising/'>computational advertising</a>, <a href='http://remonstrate.wordpress.com/tag/non-guaranteed-display/'>non-guaranteed display</a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/remonstrate.wordpress.com/4753/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/remonstrate.wordpress.com/4753/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/remonstrate.wordpress.com/4753/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/remonstrate.wordpress.com/4753/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/remonstrate.wordpress.com/4753/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/remonstrate.wordpress.com/4753/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/remonstrate.wordpress.com/4753/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/remonstrate.wordpress.com/4753/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/remonstrate.wordpress.com/4753/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/remonstrate.wordpress.com/4753/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/remonstrate.wordpress.com/4753/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/remonstrate.wordpress.com/4753/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/remonstrate.wordpress.com/4753/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/remonstrate.wordpress.com/4753/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4753&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://remonstrate.wordpress.com/2012/01/30/computational-advertising-%e7%ac%94%e8%ae%b0%ef%bc%88%e4%b8%83%ef%bc%89/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">zt</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/display-ads-ecosys.png" medium="image">
			<media:title type="html">展示广告生态系统</media:title>
		</media:content>
	</item>
		<item>
		<title>suffix tree</title>
		<link>http://remonstrate.wordpress.com/2012/01/29/suffix-tree/</link>
		<comments>http://remonstrate.wordpress.com/2012/01/29/suffix-tree/#comments</comments>
		<pubDate>Sun, 29 Jan 2012 06:37:55 +0000</pubDate>
		<dc:creator>zt</dc:creator>
				<category><![CDATA[algorithm]]></category>
		<category><![CDATA[suffix tree]]></category>

		<guid isPermaLink="false">http://remonstrate.wordpress.com/?p=4887</guid>
		<description><![CDATA[后缀树是一种非常有用的数据结构，我们虽然从这里开始讨论，后面还是有必要在合适的时候讨论 string matching 的一些其他的基本思路，作为历史发展的参考。 定义 长度为 m 的字符串对应的 suffix tree 是一个“有向的 tree”（所谓有向指跟随从 root 出发的 path）： 每条边上有 label（字符串里面的几个字符）且从一个节点出发边的 label 没有相同的首字母； 每个非 root 节点至少有两个子节点； 它有 m 个 leaf，每条从 root 到 leaf 的 path 上所有边组成字符串对应于这个字符串的一个suffix，这样我们可以对每个 leaf 进行编号，对应着字符串从第 i 个字符开始的 suffix； 这个定义存在的问题是如果字符串的某个后缀与其另一个后缀的前缀匹配，则会出现问题：因为前者是后者的前缀，两个 suffix 会共用一个 path，这导致前者对应的不是一个 leaf。解决这个问题一般通过引入特殊字符（不在 alphabet 里面）作为字符串的终止符（比如 C/C++ 的字符串终止符为 0&#215;00），这样前面说的情况短的 suffix 加上这个特殊字符是不可能作为另一个 suffix 的前缀的，这样比如 xabxa 里面的 xa 是 [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4887&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p><a href="https://secure.wikimedia.org/wikipedia/en/wiki/Suffix_tree">后缀树</a>是一种非常有用的数据结构，我们虽然从这里开始讨论，后面还是有必要在合适的时候讨论 string matching 的一些其他的基本思路，作为历史发展的参考。</p>
<p><strong>定义</strong> 长度为 m 的字符串对应的 suffix tree 是一个“有向的 tree”（所谓有向指跟随从 root 出发的 path）：</p>
<ul>
<li>每条边上有 label（字符串里面的几个字符）且从一个节点出发边的 label 没有相同的首字母；</li>
<li>每个非 root 节点至少有两个子节点；</li>
<li>它有 m 个 leaf，每条从 root 到 leaf 的 path 上所有边组成字符串对应于这个字符串的一个suffix，这样我们可以对每个 leaf 进行编号，对应着字符串从第 i 个字符开始的 suffix；</li>
</ul>
<p>这个定义存在的问题是如果字符串的某个后缀与其另一个后缀的前缀匹配，则会出现问题：因为前者是后者的前缀，两个 suffix 会共用一个 path，这导致前者对应的不是一个 leaf。解决这个问题一般通过引入特殊字符（不在 alphabet 里面）作为字符串的终止符（比如 C/C++ 的字符串终止符为 0&#215;00），这样前面说的情况短的 suffix 加上这个特殊字符是不可能作为另一个 suffix 的前缀的，这样比如 xabxa 里面的 xa 是 xabxa 这个后缀的前缀，加入 $ 这个终止符后 xa$ 就不是 xabxa$ 的前缀了，这样对应的节点肯定是在 xa 之后接上 $ 和 bxa$。</p>
<p>如果有 suffix tree 如何做 string matching 呢？</p>
<ul>
<li>首先对待搜索字符串 T 进行处理建立 suffix tree，这个可以在 <img src='http://s0.wp.com/latex.php?latex=O%28m%29&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='O(m)' title='O(m)' class='latex' /> 时间内搞定（后面会介绍做法）；</li>
<li>长度为 n 的搜索串 P 在 T 中当且仅当它出现在 T 的某个 suffix 中，因此，我们只需要看看 P 是不是出现在某个 root path 就行了，如果没有表示 P 没有被找到，如果有则所有共享这个 prefix 的 path 都是搜索结果；</li>
<li>由于每个 root path 都有对应 suffix 的编号，我们就能知道 P 出现在 T 的什么位置了；</li>
</ul>
<p>这样我们可以在 <img src='http://s0.wp.com/latex.php?latex=O%28m+%2B+n%29&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='O(m + n)' title='O(m + n)' class='latex' /> 的时间内找到所有 P 出现的位置。</p>
<p>那么如何建立一个 suffix tree 呢？比较土的想法就是通过 recursion，对于长度为 m 的字符串，我们去掉第一个字符，把问题规约成 m &#8211; 1 长度的字符串。我们知道：</p>
<ul>
<li>如果长度为 1，获得 suffix tree 就是单边，两个节点（root 和一个 leaf）的树；</li>
<li>如果我们有了一个 m &#8211; 1 字符串对应的 suffix tree，新增加一个字符，这会新增加一种 suffix：
<ul>
<li>如果该字符不是任何 m &#8211; 1 个 后缀的 prefix（也就是说没出现在后面 m-1 个字符中），那很简单，直接增加一个 node，对应的边是整个新的字符串就行了；否则</li>
<li>我们将整个新的字符串沿着 m-1 个字符的 tree 走下去，因为第一个字符出现过，所以肯定能走下去，一直碰到某个无法匹配的位置，这时我们把对应边上的 label 截断，放置一个新的 internal node，然后将原先剩余的部分连接到这个 internal node 到原先 child node 的边上（这部分保持原先的 path 不变）；产生一个新的 leaf node，将新的 internal node 与之相连，对应边是长度为 m 的字符串剩余的部分。</li>
</ul>
</li>
</ul>
<p>但是这个算法的时间复杂度为 <img src='http://s0.wp.com/latex.php?latex=O%28m%5E2%29&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='O(m^2)' title='O(m^2)' class='latex' />。另外，我们也可以将这个过程“正”过来，首先创建一个仅含有两个 node 的 suffix tree，边为整个字符串，然后我们将剩下的 suffix 一个一个插入这个 tree，</p>
<ul>
<li>如果首字母不匹配，我们就直接创建新的 leaf，并与 root 连接；</li>
<li>如果匹配，则找到最长的匹配，然后截断这个 edge 上的 label，创建新的 internal node：将新的 internal node 与原先的子 node 连接，边上为截断后剩余的 label；创建新的 child node，将此时 suffix 对应剩余部分作为连接 internel node 到此 child node 的边的 label；</li>
</ul>
<p>实现的时候后者可以两种情况写在一起：计算 share 字串（prefix）的长度，在 share 部分创建一个新的 internal node（如果需要的话），后面的产生新的 leaf 都是一样的。</p>
<p>如果想把这个算法 improve 到线性，我们需要 Ukkonen&#8217;s algorithm（其他的选择有 Weiner&#8217;s algorithm，McCreight&#8217;s algorithm）。</p>
<p>换一个角度，suffix tree 本质上就是一个将 suffix 用 trie 结构存储的索引，这个索引对很多问题都有帮助。因此实现的时候可能需要实现一个 generic 的 trie，然后在此基础上获得 suffix tree。不知道这个东西（以上各个算法）是否设计成为一个 generic algorithm 存在还是得设计成别的什么。trie 作为一个 container 或者 underlying 数据结构。</p>
<p>另外一种类似的数据结构是所谓 <a href="https://secure.wikimedia.org/wikipedia/en/wiki/Suffix_array">suffix array</a>，简单的说我们可以将所有的 suffix 组成一个数组，sort 一下（按照字典序），我们为每个 suffix 保持它的编号，以及与前一个 suffix 共同的元素个数。对应也有一些更加快捷的生成方式，这是依赖 suffix tree 获得的。</p>
<p>搜了一下，似乎 boost 里面很早就有人试图引入 suffix tree，但是没见到后文了。网上能找到的一些实现如<a href="http://marknelson.us/1996/08/01/suffix-trees/">比较早的</a>，C 的版本感觉局限性比较大（<a href="http://www.icir.org/christian/libstree/">libstree</a> 与<a href="http://mila.cs.technion.ac.il/~yona/suffix_tree/">这个</a>），有两个 C++ 的但是估计不是利用 template 写的（<a href="http://www.cs.helsinki.fi/group/suds/cst/">SuDS 的 cst</a> 与<a href="http://pizzachili.dcc.uchile.cl/api.html">这个</a>）。</p>
<p><em>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;<br />
And Abram said to Lot, Let there be no strife, I pray you, between me and you, and between my herdsmen and your herdsmen; for we be brothers.</em></p>
<br />Filed under: <a href='http://remonstrate.wordpress.com/category/academics/algorithm/'>algorithm</a> Tagged: <a href='http://remonstrate.wordpress.com/tag/suffix-tree/'>suffix tree</a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/remonstrate.wordpress.com/4887/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/remonstrate.wordpress.com/4887/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/remonstrate.wordpress.com/4887/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/remonstrate.wordpress.com/4887/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/remonstrate.wordpress.com/4887/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/remonstrate.wordpress.com/4887/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/remonstrate.wordpress.com/4887/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/remonstrate.wordpress.com/4887/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/remonstrate.wordpress.com/4887/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/remonstrate.wordpress.com/4887/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/remonstrate.wordpress.com/4887/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/remonstrate.wordpress.com/4887/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/remonstrate.wordpress.com/4887/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/remonstrate.wordpress.com/4887/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4887&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://remonstrate.wordpress.com/2012/01/29/suffix-tree/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">zt</media:title>
		</media:content>
	</item>
		<item>
		<title>重读 ESL（十）</title>
		<link>http://remonstrate.wordpress.com/2012/01/28/%e9%87%8d%e8%af%bb-esl%ef%bc%88%e5%8d%81%ef%bc%89/</link>
		<comments>http://remonstrate.wordpress.com/2012/01/28/%e9%87%8d%e8%af%bb-esl%ef%bc%88%e5%8d%81%ef%bc%89/#comments</comments>
		<pubDate>Sat, 28 Jan 2012 14:13:00 +0000</pubDate>
		<dc:creator>zt</dc:creator>
				<category><![CDATA[machine learning]]></category>
		<category><![CDATA[白日梦]]></category>
		<category><![CDATA[补遗]]></category>

		<guid isPermaLink="false">http://remonstrate.wordpress.com/?p=4263</guid>
		<description><![CDATA[末了，我想这里小结一些读书过程中觉得需要仔细研究的一些 topic： 的 regularizer 的相关研究，如 LAR、SCAD、Dantzig selector、FS 等等。 spline、wavelet、SURE 以及相关的泛函分析方面的结论。 Vapnic 的 SRM； GBDT 的原始文献，实现细节等 Bayesian neural nets SVM 的实现 FDA、MDA 这类降维算法 associate rule 的实现 主曲线相关文献 Gaussian graphical model 及其相关 multiple testing FDR 与 Benjamini-Hochberg procedure 后面我们将一个一个的通过文献来说明这里面的神奇之处。 &#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211; And there was a strife between the herdsmen of Abram&#8217;s cattle and the herdsmen of Lot&#8217;s cattle: [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4263&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>末了，我想这里小结一些读书过程中觉得需要仔细研究的一些 topic：</p>
<ul>
<li><img src='http://s0.wp.com/latex.php?latex=L%5E1&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='L^1' title='L^1' class='latex' /> 的 regularizer 的相关研究，如 LAR、SCAD、Dantzig selector、FS 等等。</li>
<li>spline、wavelet、SURE 以及相关的泛函分析方面的结论。</li>
<li>Vapnic 的 SRM；</li>
<li>GBDT 的原始文献，实现细节等</li>
<li>Bayesian neural nets</li>
<li>SVM 的实现</li>
<li>FDA、MDA 这类降维算法</li>
<li>associate rule 的实现</li>
<li>主曲线相关文献</li>
<li>Gaussian graphical model 及其相关</li>
<li>multiple testing</li>
<li>FDR 与 Benjamini-Hochberg procedure</li>
</ul>
<p>后面我们将一个一个的通过文献来说明这里面的神奇之处。</p>
<p><em>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211;<br />
And there was a strife between the herdsmen of Abram&#8217;s cattle and the herdsmen of Lot&#8217;s cattle: and the Canaanite and the Perizzite dwelled then in the land.</em></p>
<br />Filed under: <a href='http://remonstrate.wordpress.com/category/academics/machine-learning/'>machine learning</a> Tagged: <a href='http://remonstrate.wordpress.com/tag/%e7%99%bd%e6%97%a5%e6%a2%a6/'>白日梦</a>, <a href='http://remonstrate.wordpress.com/tag/%e8%a1%a5%e9%81%97/'>补遗</a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/remonstrate.wordpress.com/4263/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/remonstrate.wordpress.com/4263/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/remonstrate.wordpress.com/4263/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/remonstrate.wordpress.com/4263/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/remonstrate.wordpress.com/4263/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/remonstrate.wordpress.com/4263/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/remonstrate.wordpress.com/4263/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/remonstrate.wordpress.com/4263/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/remonstrate.wordpress.com/4263/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/remonstrate.wordpress.com/4263/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/remonstrate.wordpress.com/4263/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/remonstrate.wordpress.com/4263/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/remonstrate.wordpress.com/4263/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/remonstrate.wordpress.com/4263/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4263&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://remonstrate.wordpress.com/2012/01/28/%e9%87%8d%e8%af%bb-esl%ef%bc%88%e5%8d%81%ef%bc%89/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">zt</media:title>
		</media:content>
	</item>
		<item>
		<title>恭喜 smalladobe 新婚</title>
		<link>http://remonstrate.wordpress.com/2012/01/28/%e6%81%ad%e5%96%9c-smalladobe-%e6%96%b0%e5%a9%9a/</link>
		<comments>http://remonstrate.wordpress.com/2012/01/28/%e6%81%ad%e5%96%9c-smalladobe-%e6%96%b0%e5%a9%9a/#comments</comments>
		<pubDate>Sat, 28 Jan 2012 13:38:05 +0000</pubDate>
		<dc:creator>zt</dc:creator>
				<category><![CDATA[duck's photos]]></category>
		<category><![CDATA[smalladobe]]></category>
		<category><![CDATA[婚宴]]></category>

		<guid isPermaLink="false">http://remonstrate.wordpress.com/?p=4873</guid>
		<description><![CDATA[&#8212;&#8212;&#8212;&#8212;&#8212;&#8212; And the land was not able to bear them, that they might dwell together: for their substance was great, so that they could not dwell together. Filed under: duck's photos Tagged: smalladobe, 婚宴<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4873&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<div id="attachment_4874" class="wp-caption alignnone" style="width: 610px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3485.jpg"><img class="size-full wp-image-4874" title="新人登场" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3485.jpg?w=700" alt=""   /></a><p class="wp-caption-text">新人登场</p></div>
<div id="attachment_4875" class="wp-caption alignnone" style="width: 412px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3536.jpg"><img class="size-full wp-image-4875" title="交杯酒" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3536.jpg?w=700" alt=""   /></a><p class="wp-caption-text">交杯酒</p></div>
<div id="attachment_4876" class="wp-caption alignnone" style="width: 412px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3569.jpg"><img class="size-full wp-image-4876" title="倒香槟" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3569.jpg?w=700" alt=""   /></a><p class="wp-caption-text">倒香槟</p></div>
<div id="attachment_4877" class="wp-caption alignnone" style="width: 610px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3582.jpg"><img class="size-full wp-image-4877" title="点蜡烛" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3582.jpg?w=700" alt=""   /></a><p class="wp-caption-text">点蜡烛</p></div>
<div id="attachment_4878" class="wp-caption alignnone" style="width: 610px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3590.jpg"><img class="size-full wp-image-4878" title="新人、香槟和烛光" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3590.jpg?w=700" alt=""   /></a><p class="wp-caption-text">再次恭喜两人啦~</p></div>
<p><em>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;<br />
And the land was not able to bear them, that they might dwell together: for their substance was great, so that they could not dwell together.</em></p>
<br />Filed under: <a href='http://remonstrate.wordpress.com/category/entertainment/ducks-photos/'>duck's photos</a> Tagged: <a href='http://remonstrate.wordpress.com/tag/smalladobe/'>smalladobe</a>, <a href='http://remonstrate.wordpress.com/tag/%e5%a9%9a%e5%ae%b4/'>婚宴</a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/remonstrate.wordpress.com/4873/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/remonstrate.wordpress.com/4873/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/remonstrate.wordpress.com/4873/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/remonstrate.wordpress.com/4873/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/remonstrate.wordpress.com/4873/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/remonstrate.wordpress.com/4873/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/remonstrate.wordpress.com/4873/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/remonstrate.wordpress.com/4873/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/remonstrate.wordpress.com/4873/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/remonstrate.wordpress.com/4873/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/remonstrate.wordpress.com/4873/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/remonstrate.wordpress.com/4873/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/remonstrate.wordpress.com/4873/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/remonstrate.wordpress.com/4873/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4873&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://remonstrate.wordpress.com/2012/01/28/%e6%81%ad%e5%96%9c-smalladobe-%e6%96%b0%e5%a9%9a/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">zt</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3485.jpg" medium="image">
			<media:title type="html">新人登场</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3536.jpg" medium="image">
			<media:title type="html">交杯酒</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3569.jpg" medium="image">
			<media:title type="html">倒香槟</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3582.jpg" medium="image">
			<media:title type="html">点蜡烛</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3590.jpg" medium="image">
			<media:title type="html">新人、香槟和烛光</media:title>
		</media:content>
	</item>
		<item>
		<title>重读 ESL（九）</title>
		<link>http://remonstrate.wordpress.com/2012/01/28/%e9%87%8d%e8%af%bb-esl%ef%bc%88%e4%b9%9d%ef%bc%89/</link>
		<comments>http://remonstrate.wordpress.com/2012/01/28/%e9%87%8d%e8%af%bb-esl%ef%bc%88%e4%b9%9d%ef%bc%89/#comments</comments>
		<pubDate>Sat, 28 Jan 2012 13:31:44 +0000</pubDate>
		<dc:creator>zt</dc:creator>
				<category><![CDATA[machine learning]]></category>
		<category><![CDATA[readings]]></category>
		<category><![CDATA[Benjamini-Hochberg procedure]]></category>
		<category><![CDATA[Gaussian graphical model]]></category>
		<category><![CDATA[multiple testing]]></category>
		<category><![CDATA[probabilistic graphic model]]></category>
		<category><![CDATA[undirected graphical model]]></category>

		<guid isPermaLink="false">http://remonstrate.wordpress.com/?p=4776</guid>
		<description><![CDATA[无向图模型 无向图模型与 Bayesian belief network 有着不同的统计性质，比较重要的有其定义的等价表述，另外还有表示定理（Clifford-Hammersly 定理）告诉我们一般意义下的无向图模型对应的基本形式。ESL 在这方面介绍的不是特别详细。并且主要注重介绍连续变量下并且只有二阶关系的情况（因此是简化的模型，如 3-clique 分解成为三个 2-clique 的乘积其实是对模型的简化），这也称为 pairwise Markov graphs，比如 multivariate Gaussian 可以看成一个无向图模型，其变量间的相关性（二阶）就能刻画对应的条件独立性（对这种情况不相关等价于独立）。 比较重要的结论是通过协方差矩阵 的逆 可以刻画这个 graph 的边是否存在（如果 对应元素为 ，则对应的边不存在）。这样对于 MLE 估计来说，如果已知 graph structure，就会引入 上的约束，这往往通过 Lagrange multipliers 来进行求解。求解过程最后仍然是规约到线性回归问题，但是带有线性约束。 如果 graph structure 本身也是未知的，一种可能的策略是在 negated log-likelihood 上加上 的 regularizer，利用 lasso 将非零的 元素选择出来。这样我们就获得了需要的 graph structure。利用 LARS 这类方式可以获得整个 regularization path，这样我们就可以看到随 regularization coefficient 的变化导致图的边的增加过程。 对离散变量来说，经典的 [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4776&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p><strong>无向图模型</strong></p>
<p>无向图模型与 Bayesian belief network 有着不同的统计性质，比较重要的有其定义的等价表述，另外还有表示定理（Clifford-Hammersly 定理）告诉我们一般意义下的无向图模型对应的基本形式。ESL 在这方面介绍的不是特别详细。并且主要注重介绍连续变量下并且只有二阶关系的情况（因此是简化的模型，如 3-clique 分解成为三个 2-clique 的乘积其实是对模型的简化），这也称为 pairwise Markov graphs，比如 multivariate Gaussian 可以看成一个无向图模型，其变量间的相关性（二阶）就能刻画对应的条件独立性（对这种情况不相关等价于独立）。</p>
<p>比较重要的结论是通过协方差矩阵 <img src='http://s0.wp.com/latex.php?latex=%5CSigma&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='&#92;Sigma' title='&#92;Sigma' class='latex' /> 的逆 <img src='http://s0.wp.com/latex.php?latex=%5CTheta&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='&#92;Theta' title='&#92;Theta' class='latex' /> 可以刻画这个 graph 的边是否存在（如果 <img src='http://s0.wp.com/latex.php?latex=%5CTheta&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='&#92;Theta' title='&#92;Theta' class='latex' /> 对应元素为 <img src='http://s0.wp.com/latex.php?latex=0&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='0' title='0' class='latex' />，则对应的边不存在）。这样对于 MLE 估计来说，如果已知 graph structure，就会引入 <img src='http://s0.wp.com/latex.php?latex=%5CTheta&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='&#92;Theta' title='&#92;Theta' class='latex' /> 上的约束，这往往通过 Lagrange multipliers 来进行求解。求解过程最后仍然是规约到线性回归问题，但是带有线性约束。</p>
<p>如果 graph structure 本身也是未知的，一种可能的策略是在 negated log-likelihood 上加上 <img src='http://s0.wp.com/latex.php?latex=L%5E1&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='L^1' title='L^1' class='latex' /> 的 regularizer，利用 lasso 将非零的 <img src='http://s0.wp.com/latex.php?latex=%5CTheta&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='&#92;Theta' title='&#92;Theta' class='latex' /> 元素选择出来。这样我们就获得了需要的 graph structure。利用 LARS 这类方式可以获得整个 regularization path，这样我们就可以看到随 regularization coefficient 的变化导致图的边的增加过程。</p>
<p>对离散变量来说，经典的 undirected graphical model 就是 Boltzmann machine，这是一个 clique，其简化的版本有所谓的 restricted Boltzmann machine。Geoffrey Hinton 提出了所谓的 contrastive divergence 给出了一种训练 RBM 的方案。对于 BM 自己，一般策略有 simulated annealing，IPF（iterative proportional fitting），或者近似的策略如 mean field approximation 或者 Gibbs sampling。</p>
<p>这一章应该是非常理论化的，不过看完觉得写得比较概述，后面看一些相关 paper 可能比较有帮助。</p>
<p><strong>高维问题</strong></p>
<p>这部分讨论的是样本维数大于样本数这种情况下使用的一些策略。第一个策略就是使用 regularization 避免过多的 feature 参加了 fitting，如 regression 问题我们引入的 degree of freedom 就是一个很好的例子，控制模型的 degree of freedom 就能从某种程度避免以上问题。可以选择的 regularizer 一般是 <img src='http://s0.wp.com/latex.php?latex=L%5E2&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='L^2' title='L^2' class='latex' /> 或者 <img src='http://s0.wp.com/latex.php?latex=L%5E1&amp;bg=ffffff&amp;fg=1c1c1c&amp;s=0' alt='L^1' title='L^1' class='latex' />，后者可以利用类似 LARS 的方法进行求解。</p>
<p>另一种策略是使用 supervised principal components，这实际上是直接用单 feature 对目标进行回归，只有作用足够明显的（系数绝对值足够大）feature 参加到最后的 principal components 里面。</p>
<p>另外一种从统计方法来说，选择 feature 是一个所谓 multiple testing 问题，使用的一个准则可以是 FWER（family-wise error rate），但是这并不容易操作，可以操作的有所谓 FDR（false discovery rate），这通常使用 Benjamini-Hochberg 过程（基于 p-value 的方法）来进行测试。</p>
<p>最后一种策略是比较有意思的，不过作者似乎都是为了求解 bioinformatics 问题设计的策略。这部分也相对比较偏 theory，同样需要看一些相关的 paper。</p>
<p>至此这本书基本重新读完，某些章节还是欠了不少债的。下面开始还债啦&#8230;</p>
<p><em>&#8212;&#8212;&#8212;&#8212;&#8212;&#8211;<br />
And Lot also, which went with Abram, had flocks, and herds, and tents.</em></p>
<br />Filed under: <a href='http://remonstrate.wordpress.com/category/academics/machine-learning/'>machine learning</a>, <a href='http://remonstrate.wordpress.com/category/entertainment/readings/'>readings</a> Tagged: <a href='http://remonstrate.wordpress.com/tag/benjamini-hochberg-procedure/'>Benjamini-Hochberg procedure</a>, <a href='http://remonstrate.wordpress.com/tag/gaussian-graphical-model/'>Gaussian graphical model</a>, <a href='http://remonstrate.wordpress.com/tag/multiple-testing/'>multiple testing</a>, <a href='http://remonstrate.wordpress.com/tag/probabilistic-graphic-model/'>probabilistic graphic model</a>, <a href='http://remonstrate.wordpress.com/tag/undirected-graphical-model/'>undirected graphical model</a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/remonstrate.wordpress.com/4776/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/remonstrate.wordpress.com/4776/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/remonstrate.wordpress.com/4776/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/remonstrate.wordpress.com/4776/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/remonstrate.wordpress.com/4776/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/remonstrate.wordpress.com/4776/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/remonstrate.wordpress.com/4776/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/remonstrate.wordpress.com/4776/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/remonstrate.wordpress.com/4776/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/remonstrate.wordpress.com/4776/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/remonstrate.wordpress.com/4776/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/remonstrate.wordpress.com/4776/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/remonstrate.wordpress.com/4776/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/remonstrate.wordpress.com/4776/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4776&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://remonstrate.wordpress.com/2012/01/28/%e9%87%8d%e8%af%bb-esl%ef%bc%88%e4%b9%9d%ef%bc%89/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">zt</media:title>
		</media:content>
	</item>
		<item>
		<title>几个 GPS track</title>
		<link>http://remonstrate.wordpress.com/2012/01/27/%e5%87%a0%e4%b8%aa-gps-track/</link>
		<comments>http://remonstrate.wordpress.com/2012/01/27/%e5%87%a0%e4%b8%aa-gps-track/#comments</comments>
		<pubDate>Fri, 27 Jan 2012 08:22:51 +0000</pubDate>
		<dc:creator>zt</dc:creator>
				<category><![CDATA[duckese]]></category>
		<category><![CDATA[路线]]></category>
		<category><![CDATA[GPS]]></category>

		<guid isPermaLink="false">http://remonstrate.wordpress.com/?p=4861</guid>
		<description><![CDATA[分享一下最近 travel 获得的 track： &#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211; To the place of the altar, which he had make there at the first: and there Abram called on the name of the LORD. Filed under: duckese Tagged: 路线, GPS<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4861&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>分享一下最近 travel 获得的 track：</p>
<div id="attachment_4862" class="wp-caption alignnone" style="width: 374px"><a href="http://remonstrate.files.wordpress.com/2012/01/from-chibi-rw-to-wuchang-rw.jpg"><img class="size-full wp-image-4862" title="赤壁火车站到武昌火车站" src="http://remonstrate.files.wordpress.com/2012/01/from-chibi-rw-to-wuchang-rw.jpg?w=700" alt=""   /></a><p class="wp-caption-text">经测量火车行程为 118km。</p></div>
<div id="attachment_4863" class="wp-caption alignnone" style="width: 505px"><a href="http://remonstrate.files.wordpress.com/2012/01/from-wuchang-to-chibi-by-bus.jpg"><img class="size-full wp-image-4863" title="武昌到赤壁的长途客车行程" src="http://remonstrate.files.wordpress.com/2012/01/from-wuchang-to-chibi-by-bus.jpg?w=700" alt=""   /></a><p class="wp-caption-text">与火车相比似乎走的更接近直线，但是注意这里很早就离开了高速公路（绿色线条），从京珠高速的泉口站下来，然后途径官塘和中伙，到达新站，靠近赤壁火车站。</p></div>
<div id="attachment_4864" class="wp-caption alignnone" style="width: 670px"><a href="http://remonstrate.files.wordpress.com/2012/01/from-ldbs-to-home.jpg"><img class="size-full wp-image-4864" title="从长途汽车站到家" src="http://remonstrate.files.wordpress.com/2012/01/from-ldbs-to-home.jpg?w=700" alt=""   /></a><p class="wp-caption-text">本地的 4 路车行程，可见公交车为了拉客多绕了几个弯子...</p></div>
<div id="attachment_4865" class="wp-caption alignnone" style="width: 492px"><a href="http://remonstrate.files.wordpress.com/2012/01/from-hankou-rw-to-wuchang-rw-by-bus10.jpg"><img class="size-full wp-image-4865" title="汉口火车站到武昌火车站" src="http://remonstrate.files.wordpress.com/2012/01/from-hankou-rw-to-wuchang-rw-by-bus10.jpg?w=700" alt=""   /></a><p class="wp-caption-text">北京到武汉有四趟 Z 车，两趟停武昌，两趟停汉口，如果你需要在两边换车，可乘 10 路车，路线如上。另外汉口站有 610 到高铁站。</p></div>
<div id="attachment_4866" class="wp-caption alignnone" style="width: 394px"><a href="http://remonstrate.files.wordpress.com/2012/01/from-chibi-to-beijing.jpg"><img class="size-full wp-image-4866" title="赤壁到武昌转 Z12 到北京" src="http://remonstrate.files.wordpress.com/2012/01/from-chibi-to-beijing.jpg?w=700" alt=""   /></a><p class="wp-caption-text">嗯... 不解释了...</p></div>
<p><em>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211;<br />
To the place of the altar, which he had make there at the first: and there Abram called on the name of the LORD.</em></p>
<br />Filed under: <a href='http://remonstrate.wordpress.com/category/duckese/'>duckese</a> Tagged: <a href='http://remonstrate.wordpress.com/tag/%e8%b7%af%e7%ba%bf/'>路线</a>, <a href='http://remonstrate.wordpress.com/tag/gps/'>GPS</a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/remonstrate.wordpress.com/4861/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/remonstrate.wordpress.com/4861/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/remonstrate.wordpress.com/4861/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/remonstrate.wordpress.com/4861/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/remonstrate.wordpress.com/4861/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/remonstrate.wordpress.com/4861/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/remonstrate.wordpress.com/4861/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/remonstrate.wordpress.com/4861/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/remonstrate.wordpress.com/4861/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/remonstrate.wordpress.com/4861/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/remonstrate.wordpress.com/4861/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/remonstrate.wordpress.com/4861/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/remonstrate.wordpress.com/4861/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/remonstrate.wordpress.com/4861/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4861&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://remonstrate.wordpress.com/2012/01/27/%e5%87%a0%e4%b8%aa-gps-track/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">zt</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/from-chibi-rw-to-wuchang-rw.jpg" medium="image">
			<media:title type="html">赤壁火车站到武昌火车站</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/from-wuchang-to-chibi-by-bus.jpg" medium="image">
			<media:title type="html">武昌到赤壁的长途客车行程</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/from-ldbs-to-home.jpg" medium="image">
			<media:title type="html">从长途汽车站到家</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/from-hankou-rw-to-wuchang-rw-by-bus10.jpg" medium="image">
			<media:title type="html">汉口火车站到武昌火车站</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/from-chibi-to-beijing.jpg" medium="image">
			<media:title type="html">赤壁到武昌转 Z12 到北京</media:title>
		</media:content>
	</item>
		<item>
		<title>几个悬而未决的小问题</title>
		<link>http://remonstrate.wordpress.com/2012/01/27/%e5%87%a0%e4%b8%aa%e6%82%ac%e8%80%8c%e6%9c%aa%e5%86%b3%e7%9a%84%e5%b0%8f%e9%97%ae%e9%a2%98/</link>
		<comments>http://remonstrate.wordpress.com/2012/01/27/%e5%87%a0%e4%b8%aa%e6%82%ac%e8%80%8c%e6%9c%aa%e5%86%b3%e7%9a%84%e5%b0%8f%e9%97%ae%e9%a2%98/#comments</comments>
		<pubDate>Fri, 27 Jan 2012 07:49:18 +0000</pubDate>
		<dc:creator>zt</dc:creator>
				<category><![CDATA[duckese]]></category>
		<category><![CDATA[问题]]></category>

		<guid isPermaLink="false">http://remonstrate.wordpress.com/?p=4858</guid>
		<description><![CDATA[记下来，有空来看看有没有解决的可能： holux M241 的背光灯能否关掉？拆了肯定是 ok 的，就是不知道怎么 hack 一下那个 firmware&#8230; 主要的问题是在火车上不知道为啥背光灯会不停的闪烁，刚刚上火车的时候似乎没看到闪烁，但是时间长了似乎就开始闪烁了，也不清楚什么原因，感觉不像是搜星出现问题，因为即使没有显示 GPS searching 的时候也会闪烁。 带有 GPS 坐标的 jpg 文件是否有一个 firefox 之类的插件能够让对应的信息变成一个小地图 show 在照片边上呢？当用户的鼠标悬停的时候显示出来。尽管 firefox 的 Exif Viewer 可以显示一些相关信息，但是非要开一个新窗口，这个 UI 太傻了&#8230; 前面两次上传的照片均有 GPS 坐标，有机会可以试试看哈&#8230; M241 记录距离似乎只能显示 999.99km 以内的，不知道能不能把这个限制突破掉？ iPad 越狱之后怎么避免 installous 安装的程序（ipa）不被 itunes 删除？ 另外一个就是 iFile 浏览 ~/Applications 的时候怎么能把程序名字显示出来而不是那串类似 UUID 的东西？现在只会到 terminal 里面去 find，但是实在是太傻了。这个还是挺有用的功能，前面找了两个 RMVB 用 AcePlayer [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4858&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>记下来，有空来看看有没有解决的可能：</p>
<ul>
<li>holux M241 的背光灯能否关掉？拆了肯定是 ok 的，就是不知道怎么 hack 一下那个 firmware&#8230; 主要的问题是在火车上不知道为啥背光灯会不停的闪烁，刚刚上火车的时候似乎没看到闪烁，但是时间长了似乎就开始闪烁了，也不清楚什么原因，感觉不像是搜星出现问题，因为即使没有显示 GPS searching 的时候也会闪烁。</li>
<li>带有 GPS 坐标的 jpg 文件是否有一个 firefox 之类的插件能够让对应的信息变成一个小地图 show 在照片边上呢？当用户的鼠标悬停的时候显示出来。尽管 firefox 的 Exif Viewer 可以显示一些相关信息，但是非要开一个新窗口，这个 UI 太傻了&#8230; 前面两次上传的照片均有 GPS 坐标，有机会可以试试看哈&#8230;</li>
<li>M241 记录距离似乎只能显示 999.99km 以内的，不知道能不能把这个限制突破掉？</li>
<li>iPad 越狱之后怎么避免 installous 安装的程序（ipa）不被 itunes 删除？</li>
<li>另外一个就是 iFile 浏览 ~/Applications 的时候怎么能把程序名字显示出来而不是那串类似 UUID 的东西？现在只会到 terminal 里面去 find，但是实在是太傻了。这个还是挺有用的功能，前面找了两个 RMVB 用 AcePlayer 从 SMB 里面下载的，结果却无法播放，只能用 QQ 影音播放，这时可以直接 cut and paste 就可以了。</li>
<li>iPad 上各种应用里面最顶级的 app 是什么？这个问题比较 broad，其实 iPad 上面有一些应用感觉还是 killer application 的，写程序肯定不是（也许学习 lua 还行？），不过感觉就算写程序，也可以拿去面试用的 -,- 这个是不是太邪恶了&#8230; 个么稍微列几项看看：presentation，video/music player，pdf reader，RSS 以及 social，放松用的小游戏，bluetooth 应用（如通过 M241 获得 GPS 坐标进而实现导航 or 显示搜星的信息等），邮件，密码管理，菜肴。</li>
<li>iPad 上到底能不能装 gcc，我依照某文装了一个，结果似乎不好用 -,-</li>
<li>iPad 似乎可以作为一个 wifi AP 用还是怎么，现在似乎没法装 mywi&#8230;</li>
<li>iPad 上 cydia 似乎默认使用的几个 repository 都是收费的？那是不是说 jailbreak 只是打开了另外一条“安装收费软件的路径”，然后某些邪恶源将这些收费软件进行破解？</li>
<li>GF2 的 firmware hack 啥时候出来？可能只是时间问题？</li>
</ul>
<p><em>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;<br />
And he went on his journeys from the south even to Bethel, to the place where his tent had been at the beginning, between Bethel and Hai;</em></p>
<br />Filed under: <a href='http://remonstrate.wordpress.com/category/duckese/'>duckese</a> Tagged: <a href='http://remonstrate.wordpress.com/tag/%e9%97%ae%e9%a2%98/'>问题</a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/remonstrate.wordpress.com/4858/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/remonstrate.wordpress.com/4858/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/remonstrate.wordpress.com/4858/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/remonstrate.wordpress.com/4858/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/remonstrate.wordpress.com/4858/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/remonstrate.wordpress.com/4858/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/remonstrate.wordpress.com/4858/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/remonstrate.wordpress.com/4858/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/remonstrate.wordpress.com/4858/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/remonstrate.wordpress.com/4858/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/remonstrate.wordpress.com/4858/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/remonstrate.wordpress.com/4858/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/remonstrate.wordpress.com/4858/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/remonstrate.wordpress.com/4858/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4858&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://remonstrate.wordpress.com/2012/01/27/%e5%87%a0%e4%b8%aa%e6%82%ac%e8%80%8c%e6%9c%aa%e5%86%b3%e7%9a%84%e5%b0%8f%e9%97%ae%e9%a2%98/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">zt</media:title>
		</media:content>
	</item>
		<item>
		<title>随便拍（二十六）</title>
		<link>http://remonstrate.wordpress.com/2012/01/25/%e9%9a%8f%e4%be%bf%e6%8b%8d%ef%bc%88%e4%ba%8c%e5%8d%81%e5%85%ad%ef%bc%89/</link>
		<comments>http://remonstrate.wordpress.com/2012/01/25/%e9%9a%8f%e4%be%bf%e6%8b%8d%ef%bc%88%e4%ba%8c%e5%8d%81%e5%85%ad%ef%bc%89/#comments</comments>
		<pubDate>Wed, 25 Jan 2012 15:10:15 +0000</pubDate>
		<dc:creator>zt</dc:creator>
				<category><![CDATA[duck's photos]]></category>
		<category><![CDATA[陆水]]></category>
		<category><![CDATA[蛐蛐]]></category>
		<category><![CDATA[楚楚]]></category>

		<guid isPermaLink="false">http://remonstrate.wordpress.com/?p=4837</guid>
		<description><![CDATA[&#8212;&#8212;&#8212;&#8212;&#8212;&#8212; And Abram was very rich in cattle, in silver, and in gold. Filed under: duck's photos Tagged: 陆水, 蛐蛐, 楚楚<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4837&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<div id="attachment_4840" class="wp-caption alignnone" style="width: 412px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3226.jpg"><img class="size-full wp-image-4840" title="厂房" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3226.jpg?w=700" alt=""   /></a><p class="wp-caption-text">记得很小的时候跟 bb 跑到这边来玩。</p></div>
<div id="attachment_4841" class="wp-caption alignnone" style="width: 610px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3231.jpg"><img class="size-full wp-image-4841" title="陆水湖" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3231.jpg?w=700" alt=""   /></a><p class="wp-caption-text">今天空气能见度还比较高。</p></div>
<div id="attachment_4842" class="wp-caption alignnone" style="width: 610px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3235.jpg"><img class="size-full wp-image-4842" title="陆水河下游" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3235.jpg?w=700" alt=""   /></a><p class="wp-caption-text">与往年拍的陆水河的差别是现在尽管是枯水期，河水仍然有一定的高度，往年拍出来都是河中间的各种砂石形成的小岛什么。</p></div>
<div id="attachment_4843" class="wp-caption alignnone" style="width: 610px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3273.jpg"><img class="size-full wp-image-4843" title="苔藓" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3273.jpg?w=700" alt=""   /></a><p class="wp-caption-text">感觉不像是苔藓，或者不是记忆中的？也许是被晒干了？</p></div>
<div id="attachment_4844" class="wp-caption alignnone" style="width: 610px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3289.jpg"><img class="size-full wp-image-4844" title="叶上的积雪" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3289.jpg?w=700" alt=""   /></a><p class="wp-caption-text">虽然下过很多天了，但是还是有一点点积雪剩了下来。</p></div>
<div id="attachment_4845" class="wp-caption alignnone" style="width: 610px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3293.jpg"><img class="size-full wp-image-4845" title="远山" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3293.jpg?w=700" alt=""   /></a><p class="wp-caption-text">觉得 SP90 还是很不错的镜头，这个感觉层次感不错，几个色带分明。不知道是不是可以研究下怎么用此头挂机。</p></div>
<div id="attachment_4846" class="wp-caption alignnone" style="width: 610px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3303.jpg"><img class="size-full wp-image-4846" title="苔藓" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3303.jpg?w=700" alt=""   /></a><p class="wp-caption-text">这是在墙上的一绺苔藓。</p></div>
<div id="attachment_4847" class="wp-caption alignnone" style="width: 610px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3304.jpg"><img class="size-full wp-image-4847" title="火力发电站" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3304.jpg?w=700" alt=""   /></a><p class="wp-caption-text">远处还是有一些看不清楚，比起前两天还是好多了。</p></div>
<div id="attachment_4848" class="wp-caption alignnone" style="width: 412px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3307.jpg"><img class="size-full wp-image-4848" title="水文站的观测点" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3307.jpg?w=700" alt=""   /></a><p class="wp-caption-text">几年前还在这里游泳...</p></div>
<div id="attachment_4849" class="wp-caption alignnone" style="width: 412px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3331.jpg"><img class="size-full wp-image-4849" title="楚楚" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3331.jpg?w=700" alt=""   /></a><p class="wp-caption-text">小朋友居然怕高 -,-b</p></div>
<div id="attachment_4850" class="wp-caption alignnone" style="width: 412px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3356.jpg"><img class="size-full wp-image-4850" title="楚楚" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3356.jpg?w=700" alt=""   /></a><p class="wp-caption-text">跟姥爷牵牵手还不耐烦的小朋友。</p></div>
<div id="attachment_4851" class="wp-caption alignnone" style="width: 412px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3364.jpg"><img class="size-full wp-image-4851" title="楚楚" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3364.jpg?w=700" alt=""   /></a><p class="wp-caption-text">嘻嘻，小朋友都很喜欢蛐蛐呢~ 就是 180 不知道为啥逆光表现有些让人失望</p></div>
<div id="attachment_4852" class="wp-caption alignnone" style="width: 610px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3387.jpg"><img class="size-full wp-image-4852" title="大公鸡" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3387.jpg?w=700" alt=""   /></a><p class="wp-caption-text">很肥啊！</p></div>
<div id="attachment_4853" class="wp-caption alignnone" style="width: 412px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3414.jpg"><img class="size-full wp-image-4853" title="楚楚和蛐蛐" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3414.jpg?w=700" alt=""   /></a><p class="wp-caption-text">本来想抢个背影的...</p></div>
<div id="attachment_4854" class="wp-caption alignnone" style="width: 610px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3416.jpg"><img class="size-full wp-image-4854" title="房檐" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3416.jpg?w=700" alt=""   /></a><p class="wp-caption-text">前几天还有雪的...</p></div>
<p><em>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;<br />
And Abram was very rich in cattle, in silver, and in gold.</em></p>
<br />Filed under: <a href='http://remonstrate.wordpress.com/category/entertainment/ducks-photos/'>duck's photos</a> Tagged: <a href='http://remonstrate.wordpress.com/tag/%e9%99%86%e6%b0%b4/'>陆水</a>, <a href='http://remonstrate.wordpress.com/tag/%e8%9b%90%e8%9b%90/'>蛐蛐</a>, <a href='http://remonstrate.wordpress.com/tag/%e6%a5%9a%e6%a5%9a/'>楚楚</a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/remonstrate.wordpress.com/4837/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/remonstrate.wordpress.com/4837/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/remonstrate.wordpress.com/4837/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/remonstrate.wordpress.com/4837/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/remonstrate.wordpress.com/4837/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/remonstrate.wordpress.com/4837/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/remonstrate.wordpress.com/4837/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/remonstrate.wordpress.com/4837/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/remonstrate.wordpress.com/4837/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/remonstrate.wordpress.com/4837/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/remonstrate.wordpress.com/4837/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/remonstrate.wordpress.com/4837/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/remonstrate.wordpress.com/4837/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/remonstrate.wordpress.com/4837/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4837&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://remonstrate.wordpress.com/2012/01/25/%e9%9a%8f%e4%be%bf%e6%8b%8d%ef%bc%88%e4%ba%8c%e5%8d%81%e5%85%ad%ef%bc%89/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">zt</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3226.jpg" medium="image">
			<media:title type="html">厂房</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3231.jpg" medium="image">
			<media:title type="html">陆水湖</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3235.jpg" medium="image">
			<media:title type="html">陆水河下游</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3273.jpg" medium="image">
			<media:title type="html">苔藓</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3289.jpg" medium="image">
			<media:title type="html">叶上的积雪</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3293.jpg" medium="image">
			<media:title type="html">远山</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3303.jpg" medium="image">
			<media:title type="html">苔藓</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3304.jpg" medium="image">
			<media:title type="html">火力发电站</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3307.jpg" medium="image">
			<media:title type="html">水文站的观测点</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3331.jpg" medium="image">
			<media:title type="html">楚楚</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3356.jpg" medium="image">
			<media:title type="html">楚楚</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3364.jpg" medium="image">
			<media:title type="html">楚楚</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3387.jpg" medium="image">
			<media:title type="html">大公鸡</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3414.jpg" medium="image">
			<media:title type="html">楚楚和蛐蛐</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3416.jpg" medium="image">
			<media:title type="html">房檐</media:title>
		</media:content>
	</item>
		<item>
		<title>iPad 终于 jailbreak 了</title>
		<link>http://remonstrate.wordpress.com/2012/01/25/ipad-%e7%bb%88%e4%ba%8e-jailbreak-%e4%ba%86/</link>
		<comments>http://remonstrate.wordpress.com/2012/01/25/ipad-%e7%bb%88%e4%ba%8e-jailbreak-%e4%ba%86/#comments</comments>
		<pubDate>Wed, 25 Jan 2012 13:14:04 +0000</pubDate>
		<dc:creator>zt</dc:creator>
				<category><![CDATA[iOS]]></category>
		<category><![CDATA[absinthe]]></category>
		<category><![CDATA[iPad]]></category>
		<category><![CDATA[jailbreak]]></category>

		<guid isPermaLink="false">http://remonstrate.wordpress.com/?p=4834</guid>
		<description><![CDATA[早听说 jailbreak 如何如何，却不清楚到底能如何如何。于是这次年前发布了 untethered jailbreak 之后立即跟上了。破解过程却不如想象中那么顺利。 先是在公司里面第一次尝试，结果结束后，点开 absinthe 却打不开页面，说是要去点开某 VPN；结果点了 N 次，均没结果。 回到家之后类似方法在另一台 iPad 上成功搞定，整个过程不到 5min。 觉得是不是 Win 版的越狱软件更牛 b，然后继续用破解这个 iPad 的程序处理我的 iPad，继续无果 然后怒了，直接 restore 了我的 iPad，但是后来为了跟 mm 聊天装了个 skype，才开始破解，居然还是无果； 最后干脆继续 restore，啥都没做直接 jailbreak，成功了。 感觉整个过程挺奇怪的。anyway 弄好了之后出现了 absinthe 点开 iPad 崩溃，重启变成了 cydia。cydia 其实是一个类似 deb 包管理的工具，与 aptitude 等类似。因此很重要的就是搞到一些 repository，也不知道哪些软件源比较合适，于是在网上随便搜索了一次。首先装的是一个 installous，通过它可以安装许多被 crack 的软件。installous 和 cydia 的区别感觉是前者安装的程序可以通过正常的方式删除（比如在界面上长按然后点叉），后者安装的比如 iFile、Remote terminal 这类工具都是不能直接删除的。 [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4834&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>早听说 jailbreak 如何如何，却不清楚到底能如何如何。于是这次年前发布了 untethered jailbreak 之后立即跟上了。破解过程却不如想象中那么顺利。</p>
<ul>
<li>先是在公司里面第一次尝试，结果结束后，点开 absinthe 却打不开页面，说是要去点开某 VPN；结果点了 N 次，均没结果。</li>
<li>回到家之后类似方法在另一台 iPad 上成功搞定，整个过程不到 5min。</li>
<li>觉得是不是 Win 版的越狱软件更牛 b，然后继续用破解这个 iPad 的程序处理我的 iPad，继续无果</li>
<li>然后怒了，直接 restore 了我的 iPad，但是后来为了跟 mm 聊天装了个 skype，才开始破解，居然还是无果；</li>
<li>最后干脆继续 restore，啥都没做直接 jailbreak，成功了。</li>
</ul>
<p>感觉整个过程挺奇怪的。anyway 弄好了之后出现了 absinthe 点开 iPad 崩溃，重启变成了 cydia。cydia 其实是一个类似 deb 包管理的工具，与 aptitude 等类似。因此很重要的就是搞到一些 repository，也不知道哪些软件源比较合适，于是在网上随便搜索了一次。首先装的是一个 installous，通过它可以安装许多被 crack 的软件。installous 和 cydia 的区别感觉是前者安装的程序可以通过正常的方式删除（比如在界面上长按然后点叉），后者安装的比如 iFile、Remote terminal 这类工具都是不能直接删除的。</p>
<p>比较奇怪的是第一次和 macbook 上的 itunes 同步的时候好像 itunes 删掉了所有通过 installous 安装的程序导致我非常恼火。也不知道第二次同步会不会再出现类似的事情。下面是一些 jailbreak 之后安装的工具，现在还没搞清楚怎么用，但是觉得有时间可以玩玩。</p>
<ul>
<li>remote terminal 提供了一个 bash，不过似乎不支持我的蓝牙键盘上的 ctrl。一个基本的设想是通过 iPad 上面的基本环境，装一些编译器之类的东西，这样是不是可以在上面写程序了？</li>
<li>codea，据说是写程序的，原来叫 codify，装了一个，好象是基于 lua 的编程，不懂ing&#8230;</li>
<li>goodreader 和 pdf-notes，个人比较喜欢 pdf notes 的阅读和 goodreader 的网络传输能力。</li>
<li>另外似乎和 AcePlayer 类似有个 goodplayer，不知道优缺点；</li>
<li>omnigraffle 终于装了一个，以后可以尝试用它画图了&#8230;</li>
</ul>
<p>别的什么也不知道有什么了，大家赶紧推荐软件吧&#8230; 似乎 iphone 上面相关的 hack 多一些。</p>
<p><em>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;<br />
And Abram went up out of Egypt, he, and his wife, and all that he had, and Lot with him, into the south.</em></p>
<br />Filed under: <a href='http://remonstrate.wordpress.com/category/mobile-devices/ios/'>iOS</a> Tagged: <a href='http://remonstrate.wordpress.com/tag/absinthe/'>absinthe</a>, <a href='http://remonstrate.wordpress.com/tag/ipad/'>iPad</a>, <a href='http://remonstrate.wordpress.com/tag/jailbreak/'>jailbreak</a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/remonstrate.wordpress.com/4834/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/remonstrate.wordpress.com/4834/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/remonstrate.wordpress.com/4834/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/remonstrate.wordpress.com/4834/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/remonstrate.wordpress.com/4834/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/remonstrate.wordpress.com/4834/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/remonstrate.wordpress.com/4834/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/remonstrate.wordpress.com/4834/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/remonstrate.wordpress.com/4834/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/remonstrate.wordpress.com/4834/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/remonstrate.wordpress.com/4834/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/remonstrate.wordpress.com/4834/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/remonstrate.wordpress.com/4834/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/remonstrate.wordpress.com/4834/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4834&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://remonstrate.wordpress.com/2012/01/25/ipad-%e7%bb%88%e4%ba%8e-jailbreak-%e4%ba%86/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">zt</media:title>
		</media:content>
	</item>
		<item>
		<title>几张过年的照片</title>
		<link>http://remonstrate.wordpress.com/2012/01/25/%e5%87%a0%e5%bc%a0%e8%bf%87%e5%b9%b4%e7%9a%84%e7%85%a7%e7%89%87/</link>
		<comments>http://remonstrate.wordpress.com/2012/01/25/%e5%87%a0%e5%bc%a0%e8%bf%87%e5%b9%b4%e7%9a%84%e7%85%a7%e7%89%87/#comments</comments>
		<pubDate>Tue, 24 Jan 2012 16:35:13 +0000</pubDate>
		<dc:creator>zt</dc:creator>
				<category><![CDATA[duck's photos]]></category>
		<category><![CDATA[360]]></category>
		<category><![CDATA[腊梅]]></category>
		<category><![CDATA[蛐蛐]]></category>
		<category><![CDATA[楚楚]]></category>

		<guid isPermaLink="false">http://remonstrate.wordpress.com/?p=4825</guid>
		<description><![CDATA[&#8212;&#8212;&#8212;&#8212;&#8212;&#8212; And Pharaoh commanded his men concerning him: and they sent him away, and his wife, and all that he had. Filed under: duck's photos Tagged: 360, 腊梅, 蛐蛐, 楚楚<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4825&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<div id="attachment_4826" class="wp-caption alignnone" style="width: 610px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3099.jpg"><img class="size-full wp-image-4826" title="腊梅" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3099.jpg?w=700" alt=""   /></a><p class="wp-caption-text">由于过年的鞭炮导致梅花上面落满了灰尘，脏兮兮的...</p></div>
<div id="attachment_4827" class="wp-caption alignnone" style="width: 610px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3109.jpg"><img class="size-full wp-image-4827" title="腊梅" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3109.jpg?w=700" alt=""   /></a><p class="wp-caption-text">腊梅 again</p></div>
<div id="attachment_4828" class="wp-caption alignnone" style="width: 610px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3114.jpg"><img class="size-full wp-image-4828" title="桂花" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3114.jpg?w=700" alt=""   /></a><p class="wp-caption-text">据说是晚桂，但是没闻到什么味道。</p></div>
<div id="attachment_4829" class="wp-caption alignnone" style="width: 610px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_3137.jpg"><img class="size-full wp-image-4829" title="蛐蛐，360 和楚楚" src="http://remonstrate.files.wordpress.com/2012/01/dsc_3137.jpg?w=700" alt=""   /></a><p class="wp-caption-text">180 这种镜头拍全身景深控制也很牛啊...</p></div>
<p><em>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;<br />
And Pharaoh commanded his men concerning him: and they sent him away, and his wife, and all that he had.</em></p>
<br />Filed under: <a href='http://remonstrate.wordpress.com/category/entertainment/ducks-photos/'>duck's photos</a> Tagged: <a href='http://remonstrate.wordpress.com/tag/360/'>360</a>, <a href='http://remonstrate.wordpress.com/tag/%e8%85%8a%e6%a2%85/'>腊梅</a>, <a href='http://remonstrate.wordpress.com/tag/%e8%9b%90%e8%9b%90/'>蛐蛐</a>, <a href='http://remonstrate.wordpress.com/tag/%e6%a5%9a%e6%a5%9a/'>楚楚</a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/remonstrate.wordpress.com/4825/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/remonstrate.wordpress.com/4825/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/remonstrate.wordpress.com/4825/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/remonstrate.wordpress.com/4825/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/remonstrate.wordpress.com/4825/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/remonstrate.wordpress.com/4825/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/remonstrate.wordpress.com/4825/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/remonstrate.wordpress.com/4825/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/remonstrate.wordpress.com/4825/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/remonstrate.wordpress.com/4825/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/remonstrate.wordpress.com/4825/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/remonstrate.wordpress.com/4825/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/remonstrate.wordpress.com/4825/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/remonstrate.wordpress.com/4825/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4825&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://remonstrate.wordpress.com/2012/01/25/%e5%87%a0%e5%bc%a0%e8%bf%87%e5%b9%b4%e7%9a%84%e7%85%a7%e7%89%87/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">zt</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3099.jpg" medium="image">
			<media:title type="html">腊梅</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3109.jpg" medium="image">
			<media:title type="html">腊梅</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3114.jpg" medium="image">
			<media:title type="html">桂花</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_3137.jpg" medium="image">
			<media:title type="html">蛐蛐，360 和楚楚</media:title>
		</media:content>
	</item>
		<item>
		<title>快过年了</title>
		<link>http://remonstrate.wordpress.com/2012/01/21/%e5%bf%ab%e8%bf%87%e5%b9%b4%e4%ba%86/</link>
		<comments>http://remonstrate.wordpress.com/2012/01/21/%e5%bf%ab%e8%bf%87%e5%b9%b4%e4%ba%86/#comments</comments>
		<pubDate>Sat, 21 Jan 2012 07:14:27 +0000</pubDate>
		<dc:creator>zt</dc:creator>
				<category><![CDATA[duckese]]></category>
		<category><![CDATA[废话]]></category>

		<guid isPermaLink="false">http://remonstrate.wordpress.com/?p=4820</guid>
		<description><![CDATA[虽然才回家几天，看来现在又可以回家了。 最近北京空气质量真是差的可以，基本天天都是雾里云里。今天似乎放晴了，可能是因为风大吧！ 希望前面这么折腾的一段时间产生的消极影响尽快褪去，该干啥干啥 -.-b 这种感觉就跟被什么东西抽干了一样，实在不愿意继续这样了。 哎，前面这周写个简单的程序都搞了很久，可见效率多低下了 nnd&#8230; anyway&#8230; be focused, try hard and relax BTW：最近又上了一下 dreamtimes，原先传上去的两张依旧没有买家，于是新传了三张，其中一个 review 的意见是请把 CCD 上的灰产生的 stain 弄掉然后 resubmit，这是说 post processing 做得不到家么？我倒&#8230; 要这样很可能 SP90 这个便宜的镜头是能在那上面传上照片的“唯一”镜头了。其他的镜头似乎到现在都谬产生明显经济效益的可能性，哈哈。从另外个角度来说，以后也许应该随身带着 SP90，专攻微距。其实微距这种一般算是苦力活，器材到位之后，剩下的就是耐心和机缘了。 也许其他的镜头主要解决了一些别的问题，比如旅游、开会什么的。其实 50mm 的镜头也曾经产生一些隐形的经济效益，比如签证照片，有机会的话，大规模的拍摄一次，也算能捞一笔这个费用吧。照理说现在焦段覆盖的也足够广了，可以看看哪些焦段收益率可以发掘下了哈&#8230; 不过商业图片社的意见的确都很到位，哎挂上去几张看看有谬中奖的可能好了，mm 说的器材见涨，水平不见长看起来基本上是对的，除非真的有人买单&#8230; &#8212;&#8212;&#8212;&#8212;&#8212;&#8212; Why said you, She is my sister? so I might have taken her to me to wife: now therefore [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4820&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>虽然才回家几天，看来现在又可以回家了。</p>
<p>最近北京空气质量真是差的可以，基本天天都是雾里云里。今天似乎放晴了，可能是因为风大吧！</p>
<p>希望前面这么折腾的一段时间产生的消极影响尽快褪去，该干啥干啥 -.-b 这种感觉就跟被什么东西抽干了一样，实在不愿意继续这样了。</p>
<p>哎，前面这周写个简单的程序都搞了很久，可见效率多低下了 nnd&#8230;</p>
<p>anyway&#8230; be focused, try hard and relax</p>
<p>BTW：最近又上了一下 dreamtimes，原先传上去的两张依旧没有买家，于是新传了三张，其中一个 review 的意见是请把 CCD 上的灰产生的 stain 弄掉然后 resubmit，这是说 post processing 做得不到家么？我倒&#8230; 要这样很可能 SP90 这个便宜的镜头是能在那上面传上照片的“唯一”镜头了。其他的镜头似乎到现在都谬产生明显经济效益的可能性，哈哈。从另外个角度来说，以后也许应该随身带着 SP90，专攻微距。其实微距这种一般算是苦力活，器材到位之后，剩下的就是耐心和机缘了。</p>
<p>也许其他的镜头主要解决了一些别的问题，比如旅游、开会什么的。其实 50mm 的镜头也曾经产生一些隐形的经济效益，比如签证照片，有机会的话，大规模的拍摄一次，也算能捞一笔这个费用吧。照理说现在焦段覆盖的也足够广了，可以看看哪些焦段收益率可以发掘下了哈&#8230;</p>
<p>不过商业图片社的意见的确都很到位，哎挂上去几张看看有谬中奖的可能好了，mm 说的器材见涨，水平不见长看起来基本上是对的，除非真的有人买单&#8230;</p>
<p><em>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;<br />
Why said you, She is my sister? so I might have taken her to me to wife: now therefore behold your wife, take her, and go your way.</em></p>
<br />Filed under: <a href='http://remonstrate.wordpress.com/category/duckese/'>duckese</a> Tagged: <a href='http://remonstrate.wordpress.com/tag/%e5%ba%9f%e8%af%9d/'>废话</a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/remonstrate.wordpress.com/4820/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/remonstrate.wordpress.com/4820/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/remonstrate.wordpress.com/4820/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/remonstrate.wordpress.com/4820/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/remonstrate.wordpress.com/4820/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/remonstrate.wordpress.com/4820/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/remonstrate.wordpress.com/4820/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/remonstrate.wordpress.com/4820/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/remonstrate.wordpress.com/4820/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/remonstrate.wordpress.com/4820/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/remonstrate.wordpress.com/4820/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/remonstrate.wordpress.com/4820/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/remonstrate.wordpress.com/4820/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/remonstrate.wordpress.com/4820/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4820&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://remonstrate.wordpress.com/2012/01/21/%e5%bf%ab%e8%bf%87%e5%b9%b4%e4%ba%86/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">zt</media:title>
		</media:content>
	</item>
		<item>
		<title>三年</title>
		<link>http://remonstrate.wordpress.com/2012/01/16/%e4%b8%89%e5%b9%b4/</link>
		<comments>http://remonstrate.wordpress.com/2012/01/16/%e4%b8%89%e5%b9%b4/#comments</comments>
		<pubDate>Mon, 16 Jan 2012 01:59:00 +0000</pubDate>
		<dc:creator>zt</dc:creator>
				<category><![CDATA[music and songs]]></category>
		<category><![CDATA[蔡琴]]></category>

		<guid isPermaLink="false">http://remonstrate.wordpress.com/?p=4815</guid>
		<description><![CDATA[想得我肠儿寸断 望得我眼儿欲穿 好容易望到了你回来 算算已三年 想不到才相见 别离又在明天 这一回你去了几时来 难道又三年 左三年 右三年 这一生见面有几天 横三年 竖三年 还不如不见面 明明不能留恋 偏要苦苦缠绵 为什么放不下这条心 情愿受熬煎 tears~ &#8212;&#8212;&#8212;&#8212;&#8212;&#8212;- And Pharaoh called Abram and said, What is this that you have done to me? why did you not tell me that she was your wife? Filed under: music and songs Tagged: 蔡琴<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4815&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<blockquote><p>想得我肠儿寸断<br />
望得我眼儿欲穿<br />
好容易望到了你回来<br />
算算已三年<br />
想不到才相见<br />
别离又在明天<br />
这一回你去了几时来<br />
难道又三年</p>
<p>左三年<br />
右三年<br />
这一生见面有几天<br />
横三年<br />
竖三年<br />
还不如不见面<br />
明明不能留恋<br />
偏要苦苦缠绵<br />
为什么放不下这条心<br />
情愿受熬煎</p></blockquote>
<p>tears~</p>
<p><em>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-<br />
And Pharaoh called Abram and said, What is this that you have done to me? why did you not tell me that she was your wife?</em></p>
<br />Filed under: <a href='http://remonstrate.wordpress.com/category/entertainment/music-and-songs/'>music and songs</a> Tagged: <a href='http://remonstrate.wordpress.com/tag/%e8%94%a1%e7%90%b4/'>蔡琴</a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/remonstrate.wordpress.com/4815/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/remonstrate.wordpress.com/4815/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/remonstrate.wordpress.com/4815/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/remonstrate.wordpress.com/4815/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/remonstrate.wordpress.com/4815/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/remonstrate.wordpress.com/4815/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/remonstrate.wordpress.com/4815/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/remonstrate.wordpress.com/4815/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/remonstrate.wordpress.com/4815/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/remonstrate.wordpress.com/4815/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/remonstrate.wordpress.com/4815/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/remonstrate.wordpress.com/4815/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/remonstrate.wordpress.com/4815/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/remonstrate.wordpress.com/4815/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4815&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://remonstrate.wordpress.com/2012/01/16/%e4%b8%89%e5%b9%b4/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">zt</media:title>
		</media:content>
	</item>
		<item>
		<title>补遗</title>
		<link>http://remonstrate.wordpress.com/2012/01/16/%e8%a1%a5%e9%81%97/</link>
		<comments>http://remonstrate.wordpress.com/2012/01/16/%e8%a1%a5%e9%81%97/#comments</comments>
		<pubDate>Mon, 16 Jan 2012 01:44:12 +0000</pubDate>
		<dc:creator>zt</dc:creator>
				<category><![CDATA[duck's photos]]></category>
		<category><![CDATA[golden gate bridge]]></category>
		<category><![CDATA[San Francisco]]></category>

		<guid isPermaLink="false">http://remonstrate.wordpress.com/?p=4800</guid>
		<description><![CDATA[&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;- And the LORD plagued Pharaoh and his house with great plagues because of Sarai Abram&#8217;s wife. Filed under: duck's photos Tagged: golden gate bridge, San Francisco<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4800&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<div id="attachment_4801" class="wp-caption alignnone" style="width: 412px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_1699.jpg"><img class="size-full wp-image-4801" title="Santa Cruz 海滩" src="http://remonstrate.files.wordpress.com/2012/01/dsc_1699.jpg?w=700" alt=""   /></a><p class="wp-caption-text">Santa Cruz 海滩</p></div>
<div id="attachment_4802" class="wp-caption alignnone" style="width: 680px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_2049-dsc_2073-stereo.jpg"><img class="wp-image-4802" title="San Francisco 的海滩" src="http://remonstrate.files.wordpress.com/2012/01/dsc_2049-dsc_2073-stereo.jpg?w=670" alt="" width="670" /></a><p class="wp-caption-text">180 度接图</p></div>
<div id="attachment_4805" class="wp-caption alignnone" style="width: 610px"><a href="http://remonstrate.files.wordpress.com/2012/01/p1000577.jpg"><img class="size-full wp-image-4805" title="Golden Gate Bridge 夜景" src="http://remonstrate.files.wordpress.com/2012/01/p1000577.jpg?w=700" alt=""   /></a><p class="wp-caption-text">唯一一张能看的夜景...</p></div>
<div id="attachment_4803" class="wp-caption alignnone" style="width: 680px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_2423-dsc_2446-pano.jpg"><img class="wp-image-4803" title="Baylands Park 全景" src="http://remonstrate.files.wordpress.com/2012/01/dsc_2423-dsc_2446-pano.jpg?w=670" alt="" width="670" /></a><p class="wp-caption-text">这也是一个 180 度接图。</p></div>
<div id="attachment_4804" class="wp-caption alignnone" style="width: 610px"><a href="http://remonstrate.files.wordpress.com/2012/01/dsc_2595.jpg"><img class="size-full wp-image-4804" title="Google 的运动场" src="http://remonstrate.files.wordpress.com/2012/01/dsc_2595.jpg?w=700" alt=""   /></a><p class="wp-caption-text">门口说只有 g 家人才能进 -,-b</p></div>
<p><em>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-<br />
And the LORD plagued Pharaoh and his house with great plagues because of Sarai Abram&#8217;s wife.</em></p>
<br />Filed under: <a href='http://remonstrate.wordpress.com/category/entertainment/ducks-photos/'>duck's photos</a> Tagged: <a href='http://remonstrate.wordpress.com/tag/golden-gate-bridge/'>golden gate bridge</a>, <a href='http://remonstrate.wordpress.com/tag/san-francisco/'>San Francisco</a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/remonstrate.wordpress.com/4800/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/remonstrate.wordpress.com/4800/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/remonstrate.wordpress.com/4800/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/remonstrate.wordpress.com/4800/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/remonstrate.wordpress.com/4800/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/remonstrate.wordpress.com/4800/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/remonstrate.wordpress.com/4800/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/remonstrate.wordpress.com/4800/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/remonstrate.wordpress.com/4800/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/remonstrate.wordpress.com/4800/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/remonstrate.wordpress.com/4800/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/remonstrate.wordpress.com/4800/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/remonstrate.wordpress.com/4800/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/remonstrate.wordpress.com/4800/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=remonstrate.wordpress.com&amp;blog=7233082&amp;post=4800&amp;subd=remonstrate&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://remonstrate.wordpress.com/2012/01/16/%e8%a1%a5%e9%81%97/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="" medium="image">
			<media:title type="html">zt</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_1699.jpg" medium="image">
			<media:title type="html">Santa Cruz 海滩</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_2049-dsc_2073-stereo.jpg" medium="image">
			<media:title type="html">San Francisco 的海滩</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/p1000577.jpg" medium="image">
			<media:title type="html">Golden Gate Bridge 夜景</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_2423-dsc_2446-pano.jpg" medium="image">
			<media:title type="html">Baylands Park 全景</media:title>
		</media:content>

		<media:content url="http://remonstrate.files.wordpress.com/2012/01/dsc_2595.jpg" medium="image">
			<media:title type="html">Google 的运动场</media:title>
		</media:content>
	</item>
	</channel>
</rss>
