Hello!

To see the file structure, click on "tree".

Note that updates take place every 10 minutes, commits may not be seen immediately.
completed first draft of ensembl projection 50% reciprocal id mappings
authorpreecej <preecej@localhost>
Fri, 7 Mar 2014 18:03:42 +0000 (18:03 +0000)
committerpreecej <preecej@localhost>
Fri, 7 Mar 2014 18:03:42 +0000 (18:03 +0000)
svn path=/; revision=533

Personnel/preecej/python_singletons/map_os_2_at.py

index 783c785b17e15f2d54b938326c6a11c255bbae35..7a27776896cffdcb2ea972e6a16adfd83037c330 100755 (executable)
@@ -12,23 +12,26 @@ for line in ENS :
     cols = line.rstrip().split()
     if len(cols) == 5 :
         if int(cols[2]) >= 50 and int(cols[3]) >= 50 and int(cols[4]) == 1 :  # reciprocal identity is >= 50%, high confidence
-            dict_ens_ids[cols[0]] = cols[1]
+            if cols[0] in dict_ens_ids.keys() :
+                dict_ens_ids[cols[0]].append(cols[1])
+            else :
+                dict_ens_ids[cols[0]] = [cols[1]]
 ENS.close()
 
-for k, v in dict_ens_ids.iteritems() :
-    print k, v 
+#for k, v in dict_ens_ids.iteritems() :
+#    print k, v 
 
-OS_2_AT_MAP = open(path + "ensembl_ortho_os_2_at.tab",'w')
-# 
-RAP_IRGSP = open(path + "loc_rap_mappings.txt")
-RAP_IRGSP.readline();
-for line in RAP_IRGSP:
-    if line.strip() != "" :
-        cols = line.rstrip().split()
-        rap_id = cols[1].upper()
-        if rap_id in dict_ens_ids and rap_id != "NONE" :
-            # #print dict_ens_ids[rap_id] + "\t" + cols[0] 
-            # OS_2_AT_MAP.write(cols[0] + "\t" + dict_ens_ids[rap_id] + "\n")
-RAP_IRGSP.close()
-# 
-OS_2_AT_MAP.close()
+OS_2_AT_MAP = open(path + "ensembl_ortho_os_2_at.tab",'w')
+RAP_IRGSP = open(path + "loc_rap_mappings.txt")
+RAP_IRGSP.readline();
+for line in RAP_IRGSP:
+    if line.strip() != "" :
+        cols = line.rstrip().split()
+        rap_id = cols[1].upper()
+        if rap_id in dict_ens_ids and rap_id != "NONE" :
+            #print cols[0] + "\t" + ",".join(dict_ens_ids[rap_id]) 
+            OS_2_AT_MAP.write(cols[0] + "\t" + ",".join(dict_ens_ids[rap_id]) + "\n")
+RAP_IRGSP.close()
+
+OS_2_AT_MAP.close()