UCHIC · cjbas22 · Apr 7, 2022 · Apr 11, 2022 · Apr 11, 2022 · May 2, 2022
diff --git a/dataretrieval/nwis.py b/dataretrieval/nwis.py
@@ -12,7 +12,7 @@
 import re
 
 from dataretrieval.utils import to_str, format_datetime, update_merge, set_metadata as set_md
-from .utils import query
+from utils import query
 
 WATERDATA_BASE_URL = 'https://nwis.waterdata.usgs.gov/'
 WATERDATA_URL = WATERDATA_BASE_URL + 'nwis/'
@@ -436,9 +436,9 @@ def _iv(**kwargs):
     return _read_json(response.json()), _set_metadata(response, **kwargs)
 
 
-def get_pmcodes(parameterCd='All', **kwargs):
+def get_pmcodes(parameterCd = None, parameterNm = None):
     """
-    Return a DataFrame containing all NWIS parameter codes.
+    Return a DataFrame containing NWIS parameter codes.
 
     Note: NWIS may return incorrect column names. Rename them with
 
@@ -447,21 +447,43 @@ def get_pmcodes(parameterCd='All', **kwargs):
     Parameters (Additional parameters, if supplied, will be used as query parameters).
     ----------
         parameterCd: string or listlike
+        parameterNm: string
     Returns:
         DataFrame containing the USGS parameter codes and Metadata as tuple
     """
-    payload = {'radio_pm_search' : 'pm_search',
-               'pm_group' : 'All+--+include+all+parameter+groups',
-               'pm_search' : parameterCd,
-               'casrn_search' : None,
-               'srsname_search' : None,
-               'show' :  ['parameter_group_nm', 'casrn', 'srsname','parameter_units', 'parameter_nm'],
-               'format' : 'rdb'}
+    url = 'https://help.waterdata.usgs.gov/code/parameter_cd_nm_query?'
 
-    payload.update(kwargs)
-    url = WATERDATA_URL + 'pmcodes/pmcodes'
+    if parameterCd is None and parameterNm is None:
+        raise TypeError('Query must specify a parameter code (parameterCd = ) or name (parameterNm = )')
+
+    if parameterCd is not None and parameterNm is not None:
+        raise TypeError('Query must specify a parameter name or number, not both)')
+
+    if parameterNm is None and parameterCd is not None: # querying based on a parameter code or list of codes
+        if isinstance(parameterCd, str): # when a single code is given
+            if parameterCd.lower() == "all": # if querying ALL a different url is needed
+                payload = {'fmt':'rdb', 'group_cd':'%'}
+                url = "https://help.waterdata.usgs.gov/code/parameter_cd_query?"
+            else: # this is for querying a single parameter
+                payload = {'parm_nm_cd':parameterCd,'fmt':'rdb'}  
+        if isinstance(parameterCd, list): # Querying with a list of parameters
+            l = []
+            for param in parameterCd:
+                payload = {'parm_nm_cd':param,'fmt':'rdb'}
+                response = query(url, payload)
+                if len(response.text.splitlines()) < 10: # empty query
+                     raise TypeError('One of the parameter codes used is not valid, please try a different value')
+                l.append(_read_rdb(response.text))
+            return pd.concat(l), _set_metadata(response)
+
+    if parameterNm is not None and parameterCd is None: # querying based on a parameter name
+        parameterNm ='%{0}%'.format(parameterNm) # update to include partial matches
+        payload = {'parm_nm_cd':parameterNm,'fmt':'rdb'}  
+
     response = query(url, payload)
-    return _read_rdb(response.text), _set_metadata(response, **kwargs)
+    if len(response.text.splitlines()) < 10: # empty query
+        return ('The parameter code used is not valid, please try a different value')
+    return _read_rdb(response.text), _set_metadata(response)
 
 
 def get_water_use(years="ALL", state=None, counties="ALL", categories="ALL"):
@@ -713,7 +735,7 @@ def _read_rdb(rdb):
             break
 
     fields = re.split("[,\t]", rdb.splitlines()[count])
-    dtypes = {'site_no': str, 'dec_long_va': float, 'dec_lat_va': float}
+    dtypes = {'site_no': str, 'dec_long_va': float, 'dec_lat_va': float, 'parm_cd': str, 'parameter_cd':str}
 
     df = pd.read_csv(StringIO(rdb), delimiter='\t', skiprows=count + 2,
                      names=fields, na_values='NaN', dtype=dtypes)