omegaml
diff --git a/‎.bumpversion.cfg‎
Lines changed: 1 addition & 1 deletion b/‎.bumpversion.cfg‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎.circleci/config.yml‎
Lines changed: 3 additions & 2 deletions b/‎.circleci/config.yml‎
Lines changed: 3 additions & 2 deletions
diff --git a/‎docs/source/guide/clusters/restapi.rst‎
Lines changed: 1 addition & 1 deletion b/‎docs/source/guide/clusters/restapi.rst‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎docs/source/nb/a-snowflake-plugin-demo.ipynb‎
Lines changed: 2 additions & 2 deletions b/‎docs/source/nb/a-snowflake-plugin-demo.ipynb‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎docs/source/nb/omegaml-tutorial.ipynb‎
Lines changed: 2 additions & 3 deletions b/‎docs/source/nb/omegaml-tutorial.ipynb‎
Lines changed: 2 additions & 3 deletions
diff --git a/‎omegaml/VERSION‎
Lines changed: 1 addition & 1 deletion b/‎omegaml/VERSION‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎omegaml/backends/experiment.py‎
Lines changed: 77 additions & 31 deletions b/‎omegaml/backends/experiment.py‎
Lines changed: 77 additions & 31 deletions
@@ -1,5 +1,5 @@
 [bumpversion]
-current_version = 0.15.3
+current_version = 0.15.5
 commit = True
 tag = False
 parse = (?P<major>\d+)\.(?P<minor>\d+)\.(?P<patch>\d+)([-](?P<release>(dev|rc))+(?P<build>\d+))?
 
@@ -121,7 +121,8 @@ jobs:
               pip install -e .[dev]
               # set bdist_wheel options, see Makefile:dist
               export DISTTAGS="--python-tag py$(echo $PYVER | tr -d .)"
-              export LIVETEST_BEHAVE_EXTRA_OPTS="--tags ~tfestimator --tags ~tfkeras --tags ~snowflake" make livetest
+              export LIVETEST_BEHAVE_EXTRA_OPTS="--tags ~tfestimator --tags ~tfkeras --tags ~snowflake" 
+              make livetest
               if [[ "$VERSION" =~ "-rc" || "$VERSION" =~ "-dev" ]]; then
                 make release-test
               else
@@ -143,4 +144,4 @@ workflows:
             - test
           filters:
             branches:
-              only: /release-build.*/
+              only: /.*release-build.*/
@@ -149,7 +149,7 @@ From your omega-ml portal, get the userid and api key.
 
 .. code::
 
-    from omegacli.auth import OmegaRestApiAuth
+    from omegaml.client.cli.auth import OmegaRestApiAuth
     auth = OmegaRestApiAuth(userid, apikey)
 
 
 
@@ -14,7 +14,7 @@
     "\n",
     "Installation\n",
     "\n",
-    "1. install dependencies: `pip install --user -U snowflake-sqlalchemy==1.2.1 cffi==1.14`\n",
+    "1. install dependencies: `pip install --user -U snowflake-sqlalchemy`\n",
     "2. register snow flake: \n",
     "  \n",
     "      from sqlalchemy.dialects import registry\n",
@@ -41,7 +41,7 @@
    "outputs": [],
    "source": [
     "# install dependencies\n",
-    "!pip install --user -U snowflake-sqlalchemy==1.2.1 'cffi<1.14'\n",
+    "!pip install --user -U snowflake-sqlalchemy\n",
     "from sqlalchemy.dialects import registry\n",
     "registry.register('snowflake', 'snowflake.sqlalchemy', 'dialect')"
    ]
 
@@ -330,10 +330,9 @@
     "model = om.models.get('iris-model')\n",
     "labels = model.labels_\n",
     "\n",
-    "fig = plt.figure(figsize=(4, 3))\n",
-    "ax = Axes3D(fig, rect=[0, 0, .95, 1], elev=48, azim=134)\n",
+    "fig, ax = plt.subplots(subplot_kw={\"projection\": \"3d\"})\n",
     "ax.scatter(X[:, 3], X[:, 0], X[:, 2],\n",
-    "               c=labels.astype(np.float), edgecolor='k')\n",
+    "               c=labels.astype(float), edgecolor='k')\n",
     "fig.show()"
    ]
   },
 
@@ -1 +1 @@
-0.15.3
+0.15.5
@@ -1,18 +1,19 @@
 import getpass
-
-import dill
 import os
-import pandas as pd
-import pkg_resources
 import platform
 from base64 import b64encode, b64decode
 from datetime import datetime
 from itertools import product
 from uuid import uuid4
 
+import dill
+import pandas as pd
+import pkg_resources
+import pymongo
+
 from omegaml.backends.basemodel import BaseModelBackend
 from omegaml.documents import Metadata
-from omegaml.util import _raise, settings
+from omegaml.util import _raise, settings, ensure_index
 
 
 class ExperimentBackend(BaseModelBackend):
@@ -183,12 +184,24 @@ def active_run(self):
     def status(self, run=None):
         return 'STOPPED'
 
-    def start(self):
+    def start(self, run=None):
         raise NotImplementedError
 
     def stop(self):
         raise NotImplementedError
 
+    def start_runtime(self):
+        # hook to signal the runtime is starting a task inside a worker
+        # this is unlike the .start() method which is called to start a run
+        # which can happen in the client or in the runtime
+        pass
+
+    def stop_runtime(self):
+        # hook to signal the runtime has completed a task inside a worker
+        # this is unlike the .stop() method which is called to stop a run
+        # which can happen in the client or in the runtime
+        self.flush()
+
     def log_event(self, event, key, value, step=None, **extra):
         raise NotImplementedError
 
@@ -211,6 +224,9 @@ def tensorflow_callback(self):
     def data(self, experiment=None, run=None, event=None, step=None, key=None, raw=False):
         raise NotImplementedError
 
+    def flush(self):
+        pass
+
     @property
     def _data_name(self):
         return f'.experiments/{self._experiment}'
@@ -219,7 +235,7 @@ def _data_name(self):
 class NoTrackTracker(TrackingProvider):
     """ A default tracker that does not record anything """
 
-    def start(self):
+    def start(self, run=None):
         pass
 
     def stop(self):
@@ -261,6 +277,12 @@ class OmegaSimpleTracker(TrackingProvider):
     _ensure_active = lambda self, r: r if r is not None else _raise(
         ValueError('no active run, call .start() or .use() '))
 
+    def __init__(self, *args, **kwargs):
+        super().__init__(*args, **kwargs)
+        self.log_buffer = []
+        self.max_buffer = 10
+        self._initialize_dataset()
+
     def active_run(self, run=None):
         """ set the lastest run as the active run
 
@@ -293,8 +315,9 @@ def use(self, run=None):
 
     @property
     def _latest_run(self):
-        data = self.data(event='start', raw=True)
-        run = data[-1]['run'] if data is not None and len(data) > 0 else None
+        cursor = self.data(event='start', lazy=True)
+        data = list(cursor.sort('data.run', -1).limit(1)) if cursor else None
+        run = data[-1].get('data', {}).get('run') if data is not None and len(data) > 0 else None
         return run
 
     def status(self, run=None):
@@ -307,7 +330,7 @@ def status(self, run=None):
             status in 'STARTED', 'STOPPED'
         """
         self._run = run or self._run or self._latest_run
-        data = self.data(event=('start', 'stop'), run=self._run, raw=True)
+        data = self.data(event=['start', 'stop'], run=self._run, raw=True)
         no_runs = data is None or len(data) == 0
         has_stop = sum(1 for row in (data or []) if row.get('event') == 'stop')
         return 'PENDING' if no_runs else 'STOPPED' if has_stop else 'STARTED'
@@ -320,7 +343,7 @@ def start(self, run=None):
         self._run = run or (self._latest_run or 0) + 1
         self._startdt = datetime.utcnow()
         data = self._common_log_data('start', key=None, value=None, step=None, dt=self._startdt)
-        self._write_log(data)
+        self._write_log(data, immediate=True)
         return self._run
 
     def stop(self):
@@ -331,6 +354,14 @@ def stop(self):
         self._stopdt = datetime.utcnow()
         data = self._common_log_data('stop', key=None, value=None, step=None, dt=self._stopdt)
         self._write_log(data)
+        self.flush()
+
+    def flush(self):
+        # passing list of list forces insert_many
+        if self.log_buffer:
+            self._store.put(self.log_buffer, self._data_name,
+                            noversion=True, as_many=True)
+            self.log_buffer.clear()
 
     def _common_log_data(self, event, key, value, step=None, dt=None, **extra):
         if isinstance(value, dict):
@@ -358,8 +389,10 @@ def _common_log_data(self, event, key, value, step=None, dt=None, **extra):
         data.update(self._extra_log) if self._extra_log else None
         return data
 
-    def _write_log(self, data):
-        self._store.put(data, self._data_name, noversion=True)
+    def _write_log(self, data, immediate=False):
+        self.log_buffer.append(data)
+        if immediate or len(self.log_buffer) > self.max_buffer:
+            self.flush()
 
     def log_artifact(self, obj, name, step=None, **extra):
         """ log any object to the current run
@@ -396,7 +429,7 @@ def log_artifact(self, obj, name, step=None, **extra):
             meta = self._model_store.put(obj, f'.experiments/.artefacts/{objname}')
             format = 'model'
             rawdata = meta.name
-        elif self._store.get_backend_by_obj(obj) is not None:
+        elif self._store.get_backend_byobj(obj) is not None:
             objname = uuid4().hex
             meta = self._store.put(obj, f'.experiments/.artefacts/{objname}')
             format = 'dataset'
@@ -485,16 +518,17 @@ def log_extra(self, remove=False, **kwargs):
             consume(deletions, maxlen=0)
 
     def data(self, experiment=None, run=None, event=None, step=None, key=None, raw=False,
-             **extra):
+             lazy=False, **extra):
         """ build a dataframe of all stored data
 
         Args:
-            experiment (str): the name of the experiment, defaults to its current value
+            experiment (str|list): the name of the experiment, defaults to its current value
             run (int|list): the run(s) to get data back, defaults to current run, use 'all' for all
             event (str|list): the event(s) to include
             step (int|list): the step(s) to include
             key (str|list): the key(s) to include
             raw (bool): if True returns the raw data instead of a DataFrame
+            lazy (bool): if True returns the Cursor instead of data, ignores raw
 
         Returns:
             * data (DataFrame) if raw == False
@@ -519,12 +553,19 @@ def data(self, experiment=None, run=None, event=None, step=None, key=None, raw=F
         for k, v in extra.items():
             if valid(k):
                 filter[f'data.{k}'] = op(v)
-        data = self._store.get(self._data_name, filter=filter)
-        if data is not None and not raw:
+        data = self._store.get(self._data_name, filter=filter, lazy=lazy)
+        if data is not None and not raw and not lazy:
             data = pd.DataFrame.from_records(data)
             data.sort_values('dt', inplace=True) if 'dt' in data.columns else None
         return data
 
+    def _initialize_dataset(self, force=False):
+        # create indexes when the dataset is first created
+        if not force and self._store.exists(self._data_name):
+            return
+        coll = self._store.collection(self._data_name)
+        ensure_index(coll, {'data.run': pymongo.ASCENDING, 'data.event': pymongo.ASCENDING})
+
     def restore_artifact(self, key=None, experiment=None, run=None, step=None, value=None):
         """ restore a logged artificat
 
@@ -596,7 +637,7 @@ class OmegaProfilingTracker(OmegaSimpleTracker):
     def __init__(self, *args, **kwargs):
         super().__init__(*args, **kwargs)
         self.profile_logs = []
-        self.max_buffer = 6
+        self.max_buffer = 10
 
     def log_profile(self, data):
         """ the callback for BackgroundProfiler """
@@ -605,27 +646,32 @@ def log_profile(self, data):
             self.flush()
 
     def flush(self):
-        for step, data in enumerate(self.profile_logs):
-            # record the actual time instead of logging time (avoid buffering delays)
-            dt = data.get('profile_dt')
-            for k, v in data.items():
-                self.log_event('profile', k, v, step=step, dt=dt)
-        self.profile_logs = []
-
-    def start(self):
+        def log_items():
+            for step, data in enumerate(self.profile_logs):
+                # record the actual time instead of logging time (avoid buffering delays)
+                dt = data.get('profile_dt')
+                for k, v in data.items():
+                    item = self._common_log_data('profile', k, v, step=step, dt=dt)
+                    yield item
+        if self.profile_logs:
+            self._store.put([item for item in log_items()], self._data_name,
+                            index=['event'], as_many=True, noversion=True)
+            self.profile_logs = []
+
+    def start_runtime(self):
         self.profiler = BackgroundProfiler(callback=self.log_profile)
         self.profiler.start()
-        super().start()
+        super().start_runtime()
 
-    def stop(self):
+    def stop_runtime(self):
         self.profiler.stop()
         self.flush()
-        super().stop()
+        super().stop_runtime()
 
 
 try:
     from tensorflow import keras
-except:
+except Exception:
     pass
 else:
     class TensorflowCallback(keras.callbacks.Callback):