<html>
<body>
Hi Scott,<br><br>
I used ncbi powerscript to download the chromosome genbank file (it took
2 hrs 10 min) then used your bp_genbank2gff.pl to load db.&nbsp; Looks
like the tables are populated:<br><br>
o fattribute ( <font color="#FF0000">13</font> records )<br>
o fattribute_to_feature ( <font color="#FF0000">7782</font> records
)<br>
o fdata ( <font color="#FF0000">10939</font> records )<br>
o fdna ( <font color="#FF0000">44259</font> records )<br>
o fgroup ( <font color="#FF0000">1953</font> records )<br>
o fmeta ( <font color="#FF0000">4</font> records )<br>
o ftype ( <font color="#FF0000">8</font> records )<br><br>
but I still cannot bring up the graphs:<br>
<a href="http://www.animalgenome.org/cgi-bin/gbrowse/cattle/" eudora="autourl">
http://www.animalgenome.org/cgi-bin/gbrowse/cattle/<br><br>
</a>Could you help to see if I have any key part missing from the config
file:<br>
<a href="http://www.animalgenome.org/hu/share/scott/cow.conf" eudora="autourl">
http://www.animalgenome.org/hu/share/scott/cow.conf<br><br>
</a>Thank you,<br><br>
Zhiliang<br><br>
<br>
At 10:33 AM 9/24/2008 -0400, Scott Cain wrote:<br>
<blockquote type=cite class=cite cite="">There seems to be a problem with
BioPerl related to getting the<br>
sequence directly from GenBank: if I download NC_007320 and then
run<br><br>
&nbsp;&nbsp; bp_genbank2gff.pl --file NC_007320.gbk&nbsp; --dsn
dbi:mysql:test --create<br><br>
it works fine in a couple of seconds.&nbsp; If however I run<br><br>
&nbsp; bp_genbank2gff.pl --accession NC_007320&nbsp; --dsn dbi:mysql:test
--create<br><br>
I get these two lines over and over again as it runs for a long time<br>
(I'm letting it go now so I can see how long it will take and what<br>
will eventually happen):<br><br>
Use of uninitialized value in pattern match (m//) at<br>
/usr/local/share/perl/5.8.8/Bio/SeqIO/genbank.pm line 663, &lt;GEN1&gt;
line<br>
115.<br>
Use of uninitialized value in pattern match (m//) at<br>
/usr/local/share/perl/5.8.8/Bio/SeqIO/genbank.pm line 667, &lt;GEN1&gt;
line<br>
115.<br><br>
Scott<br><br>
<br>
On Wed, Sep 24, 2008 at 9:56 AM, Zhiliang Hu &lt;zhu@iastate.edu&gt;
wrote:<br>
&gt; I repeated on the same machine (RHEL/RedHat Linux 2.4.21-20.ELsmp,
8GB RAM)<br>
&gt; - I counted 7 minutes before its quit on &quot;Out of memory!&quot;
this time.<br>
&gt;<br>
&gt; I then installed Bioperl/GBrowse/etc last night on another machine
(Linux<br>
&gt; CentOS, 8GB RAM), tried the same to run on background.<br>
&gt;<br>
&gt; This morning I found the processes died away without loading the db.
I<br>
&gt; didn't find any core dump or else but only in the /tmp dir a file
created<br>
&gt; shortly after I started it:<br>
&gt;
<a href="http://nagrp2.ansci.iastate.edu/zhu/tmp/RJQApIbFbh.txt" eudora="autourl">
http://nagrp2.ansci.iastate.edu/zhu/tmp/RJQApIbFbh.txt</a> -- this
doesn't seem<br>
&gt; to be right because on the browser it seems to be HUGE:<br>
&gt;
<a href="http://www.ncbi.nlm.nih.gov/entrez/viewer.fcgi?val=194719399&amp;view=gbwithparts" eudora="autourl">
http://www.ncbi.nlm.nih.gov/entrez/viewer.fcgi?val=194719399&amp;view=gbwithparts</a>
<br>
&gt;<br>
&gt; Zhiliang<br>
&gt;<br>
&gt;<br>
&gt; At 11:17 PM 9/23/2008 -0400, Lincoln Stein wrote:<br>
&gt;<br>
&gt; It may take a long time to run - try overnight.<br>
&gt;<br>
&gt; Lincoln<br>
&gt;<br>
&gt; On Tue, Sep 23, 2008 at 10:46 PM, Scott Cain
&lt;cain.cshl@gmail.com&gt; wrote:<br>
&gt; When I ran it, it spun it's wheels for a long time (30+ minutes) and
I<br>
&gt; killed it.&nbsp;&nbsp; I tried the analagous thing with
bp_genbank2gff.pl and<br>
&gt; had to kill it too.&nbsp; I thought it was a problem with bioperl
until<br>
&gt; just now, when I tried it with an E coli chromosome from genbank
and<br>
&gt; it worked fine (it ran a couple of minutes).<br>
&gt;<br>
&gt; Scott<br>
&gt;<br>
&gt;<br>
&gt; On Tue, Sep 23, 2008 at 10:13 PM, Lincoln Stein
&lt;lincoln.stein@gmail.com &gt;<br>
&gt; wrote:<br>
&gt;&gt; Oh no! I've never seen a memory problem before. How long a time
elapses<br>
&gt;&gt; between the original loading message and the first Out of
memory! message?<br>
&gt;&gt;<br>
&gt;&gt; Lincoln<br>
&gt;&gt;<br>
&gt;&gt; On Tue, Sep 23, 2008 at 1:25 PM, Zhiliang Hu
&lt;zhu@iastate.edu&gt; wrote:<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Scott,<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; I decide to take an &quot;easier&quot; approach as a start -
I will try to load<br>
&gt;&gt;&gt; NCBI<br>
&gt;&gt;&gt; and UCSC cattle genomes to GBrowse.&nbsp; Once that works, I
can move on with<br>
&gt;&gt;&gt; more customized data sets.<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; I have following questions in doing that:<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; 1.<br>
&gt;&gt;&gt; A technical one: When I try to load a cattle chromosome
using your<br>
&gt;&gt;&gt; 'load_genbank.pl', I got a memory problem (there is 8 GB RAM
on the<br>
&gt;&gt;&gt; machine<br>
&gt;&gt;&gt; - I bet there must a work around?)<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; &gt; load_genbank.pl --create -dsn dbi:mysql:gb_cattle -user
--pass<br>
&gt;&gt;&gt; &gt; --accession NC_007320<br>
&gt;&gt;&gt; Loading NC_007320...<br>
&gt;&gt;&gt; Out of memory!<br>
&gt;&gt;&gt; Out of memory!<br>
&gt;&gt;&gt; Out of memory!<br>
&gt;&gt;&gt; Segmentation fault (core dumped)<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; 2.<br>
&gt;&gt;&gt; Can I load all chromosomes into one database?&nbsp; Or
should I create<br>
&gt;&gt;&gt; separate<br>
&gt;&gt;&gt; databases for each chromosome? (I assume the former but not
sure).<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; 3.<br>
&gt;&gt;&gt; If I also bring in UCSC golden tracks, should I set up a
different<br>
&gt;&gt;&gt; database, Or can I put them into one db, naming UCSC
chromosomes a little<br>
&gt;&gt;&gt; differently?<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Thank you,<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Zhiliang<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; --<br>
&gt;&gt;&gt; Zhi-Liang Hu (PhD)<br>
&gt;&gt;&gt; Associate Scientist,<br>
&gt;&gt;&gt; Department of Animal Science,<br>
&gt;&gt;&gt; Center for Integrated Animal Genomics,<br>
&gt;&gt;&gt; National Animal Genome Research Program,<br>
&gt;&gt;&gt; Iowa State University<br>
&gt;&gt;&gt; Tel: 901-759-0643<br>
&gt;&gt;&gt; Mob: 901-212-2820<br>
&gt;&gt;&gt; Web:
<a href="http://www.animalgenome.org/" eudora="autourl">
http://www.animalgenome.org</a><br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; &quot;Not everything that counts can be counted, and<br>
&gt;&gt;&gt;&nbsp;&nbsp;&nbsp;&nbsp; not everything that can be counted
counts.&quot;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; --<br>
&gt;&gt; Lincoln D. Stein<br>
&gt;&gt;<br>
&gt;&gt; Ontario Institute for Cancer Research<br>
&gt;&gt; 101 College St., Suite 800<br>
&gt;&gt; Toronto, ON, Canada M5G0A3<br>
&gt;&gt; 416 673-8514<br>
&gt;&gt; Assistant: Stacey Quinn &lt;Stacey.Quinn@oicr.on.ca &gt;<br>
&gt;&gt;<br>
&gt;&gt; Cold Spring Harbor Laboratory<br>
&gt;&gt; 1 Bungtown Road<br>
&gt;&gt; Cold Spring Harbor, NY 11724 USA<br>
&gt;&gt; (516) 367-8380<br>
&gt;&gt; Assistant: Sandra Michelsen &lt;michelse@cshl.edu&gt;<br>
&gt;&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; --<br>
&gt;
------------------------------------------------------------------------<br>
&gt; Scott Cain, Ph. D. cain.cshl@gmail.com<br>
&gt; GMOD Coordinator
(<a href="http://gmod.org/" eudora="autourl">http://gmod.org/</a>)
216-392-3087<br>
&gt; Cold Spring Harbor Laboratory<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; --<br>
&gt; Lincoln D. Stein<br>
&gt;<br>
&gt; Ontario Institute for Cancer Research<br>
&gt; 101 College St., Suite 800<br>
&gt; Toronto, ON, Canada M5G0A3<br>
&gt; 416 673-8514<br>
&gt; Assistant: Stacey Quinn &lt;Stacey.Quinn@oicr.on.ca &gt;<br>
&gt;<br>
&gt; Cold Spring Harbor Laboratory<br>
&gt; 1 Bungtown Road<br>
&gt; Cold Spring Harbor, NY 11724 USA<br>
&gt; (516) 367-8380<br>
&gt; Assistant: Sandra Michelsen &lt;michelse@cshl.edu &gt;<br><br>
<br><br>
-- <br>
------------------------------------------------------------------------<br>
Scott Cain, Ph. D. cain.cshl@gmail.com<br>
GMOD Coordinator
(<a href="http://gmod.org/" eudora="autourl">http://gmod.org/</a>)
216-392-3087<br>
Cold Spring Harbor Laboratory</blockquote></body>
</html>