<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">

<head>
<meta http-equiv=Content-Type content="text/html; charset=us-ascii">
<meta name=Generator content="Microsoft Word 12 (filtered medium)">
<style>
<!--
 /* Font Definitions */
 @font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
-->
</style>
<!--[if gte mso 9]><xml>
 <o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
 <o:shapelayout v:ext="edit">
  <o:idmap v:ext="edit" data="1" />
 </o:shapelayout></xml><![endif]-->
</head>

<body lang=EN-US link=blue vlink=purple>

<div class=WordSection1>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Chris,<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>I am a new postdoc working for Scott Geib.&nbsp; Please pardon
any redundancy or confusion on my part.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>fyi, I am including gmod help in case they can more readily
answer my questions.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Your input is very much appreciated here, where we are sequencing
the oriental fruit fly genome along with transcripts, and are in the initial
stages of web and database development.&nbsp; I have worked at the Broad
Institute and TAIR, so I am familiar with using these things, but they were
already well constructed before my arrival.&nbsp; Here at the USDA we are
starting from scratch.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Right now, there are a few things I want to ask about.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>One thing I am unclear about is the distinction between a
GBrowse db and a drupal db.&nbsp; <o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Would the drupal db be part of web user queries?&nbsp; For
example, if a web user wants a list of all kinases, would the search only use
the drupal db?&nbsp; If so, it seems redundant to me.&nbsp; We will have all of
the information in a genomics db, perhaps with a Chado schema. &nbsp;I can see
that using this for web queries might pose integrity risks.&nbsp; Are you
suggesting that we use 2 somewhat overlapping db, one for internal use and
another for public use.&nbsp; If so, I see the public db being mostly a subset
of the internal one, with us choosing which fields to make public, and possibly
adding tables for web specific info, such as links followed or user info. <o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>&nbsp;Alternatively, should we use the GBrowse db for internal
use as well as the backend for genome related web use, and limit the drupal db
use to nongenome related web info?<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Should we use the same RDBMS for both?&nbsp; It would seem to be
simpler, but I may be missing some reasons why we need both mySQL and
PostgreSQL.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>While I am on the subject, does PostgreSQL have problems with
the size of sequence objects?&nbsp; Should that factor into our decisions?<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>As for which tools we will use, I think that a lot of decisions
remain.&nbsp; We may use GBrowse and Apollo, but I am also experimenting with
Argo.&nbsp; I was leaning toward using Chado, but from your email, and from
looking at the tables, it seems that we may want to use another schema,
probably simpler than Chado for our purposes.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Is GBrowse limited to the schemas outlined under adaptors in the
following?<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>http://gmod.org/wiki/GBrowse#About_Databases<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Do you know which ones are most supported or least buggy?&nbsp;
Do you have a recommendation?<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>In a related inquiry, are the Gmod tools flexible?&nbsp; <o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>I see a lot of tables in Chado, which is great, but for whatever
db we use, can we add or delete tables? &nbsp;How difficult is it to
incorporate new tools or info?<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>&nbsp;For example, we are dealing with multiple strains/species.&nbsp;
If SNP analysis is not in the db, can we add table for it, or are we
constrained to existing tables and fields?<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>In addition, how well do the GMOD tools and db's handle existing
functional or structural analysis or adapt to new analysis tools?<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Finally, at USDA, we are interested in biotic
interactions.&nbsp; Are there tables to link organisms like there are for
linking protein interactions?&nbsp; If not, are the tools extensible for that?&nbsp;
<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>It looks like anything that can be mapped out as a feature with
genome coordinates can be handled.&nbsp; So if we use new tools, or find pathogenicity
genes or markers, then we can use GMOD.&nbsp; Perhaps you can correct that if
it is wrong or too simplistic.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>I think that is enough for today.&nbsp; It seems that I still
have a lot to figure out.&nbsp; Sorry if this is too long. &nbsp;As I learn
more and we progress, I will likely seek out more advice.&nbsp; If you would
prefer to talk to me on the phone, please call the number below.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Thanks for all of you help to date and for any feedback you can
provide to this inquiry.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Tom Walk<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>tom.walk@ars.usda.gov<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>808 932 2176<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<div style='border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0in 0in 0in'>

<p class=MsoNormal><b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'>From:</span></b><span
style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'> Chris Childers
[mailto:genetics.guy@gmail.com] <br>
<b>Sent:</b> Wednesday, October 20, 2010 4:22 AM<br>
<b>To:</b> Natasha Sostrom<br>
<b>Subject:</b> Re: Bee Base site - databases<o:p></o:p></span></p>

</div>

<p class=MsoNormal><o:p>&nbsp;</o:p></p>

<p class=MsoNormal style='margin-bottom:12.0pt'>Hi Natasha,<br>
<br>
The short answer is that I would recommend keeping your GBrowse database
separate from the drupal database, for the simple reason that this allows you
to have more flexibility in the future.&nbsp; You might want to run both
databases on MySQL or Postgres, or have one on each.&nbsp; I'll talk a little
more about this below.&nbsp; I apologize if this is something you already know
about, but I wanted to try clarifying my earlier response.&nbsp; The long
answer is below.<br>
<br>
There is an important distinction that a lot of people can get mixed up over
when talking about databases, and this can be confusing to folks that are just
getting into it.&nbsp; There are actually two distinct things people talk about
when they mention databases.&nbsp; One is a &quot;RDBMS&quot; or Relational Database
Management System&quot;, and the other is the databases that live in that
system.&nbsp; <br>
<br>
The RDBMS is something like&nbsp; MySQL, or postrges, or Oracle, and it
includes all the software for storing and managing information.&nbsp; Many of
the RDBMS out there use SQL, and there is a lot of overlap in how you interact
with the data, regardless of whether it is a postgres or mysql database.&nbsp;
There are some differences though, and that's why people use different systems
for different uses.&nbsp; Each RDBMS can hold many databases, and each database
can have lots of data.&nbsp; <br>
<br>
The GMOD tool Chado is the main relational database for housing all the
information you might have, but it has historically had problems when used as a
back end for GBrowse.&nbsp; GBrowse has several different database schemas (a
schema is like a blueprint for how to store the data)&nbsp; that it can use, as
long as you specify which one you use. &nbsp; <br>
<br>
That was why I was asking if you were still planning to only use GBRowse, or if
you had decided to also start using Chado.&nbsp; If you are going to use Chado,
I have heard that the new version of GBrowse runs a lot better with it, but I
haven't tested it myself.&nbsp; If you guys are only planning to use GBrowse,
you might just want to use one of the basic MySQL databases.&nbsp; Those are
much smaller and run really fast.&nbsp; <br>
<br>
Sorry about the long winded answer.&nbsp; I hope this helps you guys with your
planning.&nbsp; <br>
<br>
Thanks,<br>
Chris<o:p></o:p></p>

<div>

<p class=MsoNormal>On Tue, Oct 19, 2010 at 7:44 PM, Natasha Sostrom &lt;<a
href="mailto:sostrom@hawaii.edu" target="_blank">sostrom@hawaii.edu</a>&gt;
wrote:<o:p></o:p></p>

<p class=MsoNormal>Chris,<br>
<br>
<br>
I&nbsp;apologize&nbsp;for not being clear about what the situation was. Right
now we are still in the development stage. Nothing has gone live, and we are
trying to make some decisions about where we want our site to go and
such.&nbsp;<br>
<br>
<br>
MySQL is what we were using for the general&nbsp;functionality&nbsp;of the
Drupal site. As we speak we have not set up anything on the website to display
data. Is it best to JUST use postgres?<br>
<br>
<br>
I did see the iFrame module, which seems very useful. Which is why I'm
wondering whether we should use two separate databases or just one. To chose
just ONE database for the entire website, which would be best?<br>
<br>
<br>
Thank you<br>
<span style='color:#888888'>Natasha Sostrom</span><o:p></o:p></p>

<div>

<div>

<p class=MsoNormal><br>
<br>
----- Original Message -----<br>
From: Chris Childers &lt;<a href="mailto:genetics.guy@gmail.com" target="_blank">genetics.guy@gmail.com</a>&gt;<br>
Date: Tuesday, October 19, 2010 3:33 am<br>
Subject: Re: Bee Base site - databases<br>
To: Natasha Sostrom &lt;<a href="mailto:sostrom@hawaii.edu" target="_blank">sostrom@hawaii.edu</a>&gt;<br>
<br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span>Hi Natasha,<br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span><br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span>Are you still
planning to run GBrowse only, or are you using Chado?&nbsp; In our lab, we have
instances of Chado to store our community annotation data and mysql databases
to house the GBrowse data.&nbsp; <br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span><br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span>When you say a
mysql database site, are you referring to a GBrowse page?&nbsp; Or are you
using some other software to display the data in the postgres database?&nbsp; <br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span><br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span>In terms of
showing a GBrowse page using an iframe, this is not a problem as long as you
are nor planning to send extra information va the address bar.&nbsp; Drupal has
an iframe plugin that simplifies the syntax for making an iframe, and it can
auto set the frame height to the length of the page, which is great for
dynamically generated pages.&nbsp; <br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span><br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span>I hope this
helps,<br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span>Chris<br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span><o:p></o:p></p>

<div>

<p class=MsoNormal><span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span>On
Mon, Oct 18, 2010 at 8:17 PM, Natasha Sostrom &lt;sostrom@hawaii.edu&gt; wrote:<o:p></o:p></p>

<p class=MsoNormal><span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span>Chris,<br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span><br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span><br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span>I emailed you a
while back about Gbrowse and Drupal. Now we have come to find that we need to
use PostgreSQL for GMOD, while the Drupal site is currently using MySQL. In the
last email you mentioned using iFrames which is a good way to display a
postgresql database site within a mysql site. Is this what you did?&nbsp;<br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span><br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span><br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span>A fellow employee
mentioned that it may be best to just use one database (migrating to
PostgreSQL).<br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span><br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span><br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span>Do you have any
insight about this?&nbsp;<br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span><br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span><br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span>Thanks in
advance,<br>
<span style='font-size:10.5pt;color:#888888;background:#F5F8F0'>&gt; </span><span
style='color:#888888'>Natasha Sostrom&nbsp; </span><o:p></o:p></p>

</div>

<p class=MsoNormal><span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span><br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span><br clear=all>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span><br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span>-- <br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span>Chris Childers<br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span>Postdoctoral
Fellow<br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span>Elsik
Computational Genomics Laboratory<br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span>Georgetown
University<br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span>Department of
Biology<br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span>406 Reiss Bldg<br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span>Washington, DC
20057<br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span>Phone
202-687-5855<br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span>Fax 202-687-5662<br>
<span style='font-size:10.5pt;background:#F5F8F0'>&gt; </span><o:p></o:p></p>

</div>

</div>

</div>

<p class=MsoNormal style='margin-bottom:12.0pt'><br>
<br clear=all>
<br>
-- <br>
Chris Childers<br>
Postdoctoral Fellow<br>
Elsik Computational Genomics Laboratory<br>
Georgetown University<br>
Department of Biology<br>
406 Reiss Bldg<br>
Washington, DC 20057<br>
Phone 202-687-5855<br>
Fax 202-687-5662<o:p></o:p></p>

</div>

</body>

</html>