re-added functionality for installing sparse coding source as a python package

c1d031a1 · hannandarryl · b7c2185a · c1d031a1 · c1d031a1 · c1d031a1
Commit c1d031a1 authored 3 years ago by hannandarryl
--- a/setup.cfg
+++ b/setup.cfg
@@ -2,7 +2,7 @@
 name = sparse_coding_torch
 author = Christopher J. MacLellan
 author-email = christopher.maclellan@drexel.edu
-summary = A library for doing sparse coding using PyTorch
+summary = A library for doing sparse coding using Keras
 description-file = README.rst
 description-content-type = text/x-rst; charset=UTF-8
 home-page = https://gitlab.cci.drexel.edu/teachable-ai-lab/sparse_coding_torch

--- a/setup.py
+++ b/setup.py
+from setuptools import setup
+setup(
+    setup_requires=['pbr'],
+    pbr=True
+)
\ No newline at end of file
--- a/keras/generate_tflite.py
+++ b/keras/generate_tflite.py
@@ -6,8 +6,8 @@ import cv2
 import torchvision as tv
 import torch
 import torch.nn as nn
-from video_loader import VideoGrayScaler, MinMaxScaler
+from sparse_coding_torch.video_loader import VideoGrayScaler, MinMaxScaler
-from keras_model import MobileModel
+from sparse_coding_torch.keras_model import MobileModel
 inputs = keras.Input(shape=(5, 100, 200, 3))

--- a/keras/keras_model.py
+++ b/keras/keras_model.py
@@ -6,7 +6,7 @@ import cv2
 import torchvision as tv
 import torch
 import torch.nn as nn
-from video_loader import VideoGrayScaler, MinMaxScaler
+from sparse_coding_torch.video_loader import VideoGrayScaler, MinMaxScaler
 def load_pytorch_weights(file_path):
    pytorch_checkpoint = torch.load(file_path, map_location='cpu')

--- a/keras/load_data.py
+++ b/keras/load_data.py
@@ -2,9 +2,9 @@ import numpy as np
 import torchvision
 import torch
 from sklearn.model_selection import train_test_split
-from video_loader import MinMaxScaler
+from sparse_coding_torch.video_loader import MinMaxScaler
-from video_loader import YoloClipLoader, get_video_participants, PNBLoader
+from sparse_coding_torch.video_loader import YoloClipLoader, get_video_participants, PNBLoader
-from video_loader import VideoGrayScaler
+from sparse_coding_torch.video_loader import VideoGrayScaler
 import csv
 from sklearn.model_selection import train_test_split, GroupShuffleSplit, LeaveOneGroupOut, LeaveOneOut, StratifiedGroupKFold, StratifiedKFold, KFold
@@ -54,7 +54,7 @@ def load_yolo_clips(batch_size, mode, num_clips=1, num_positives=100, device=Non
        return None
-def load_pnb_videos(batch_size, mode, device=None, n_splits=None, sparse_model=None):   
+def load_pnb_videos(batch_size, mode, classify_mode=False, device=None, n_splits=None, sparse_model=None):   
    video_path = "/shared_data/bamc_pnb_data/full_training_data"
    transforms = torchvision.transforms.Compose(
@@ -70,7 +70,7 @@ def load_pnb_videos(batch_size, mode, device=None, n_splits=None, sparse_model=N
     torchvision.transforms.RandomAffine(degrees=0, translate=(0.05, 0))
 #      torchvision.transforms.CenterCrop((100, 200))
    ])
-    dataset = PNBLoader(video_path, num_frames=5, frame_rate=20, transform=transforms)
+    dataset = PNBLoader(video_path, classify_mode, num_frames=5, frame_rate=20, transform=transforms, augmentation=augment_transforms)
    targets = dataset.get_labels()

--- a/keras/train_classifier.py
+++ b/keras/train_classifier.py
@@ -4,8 +4,8 @@ import torch.nn.functional as F
 from tqdm import tqdm
 import argparse
 import os
-from load_data import load_yolo_clips, load_pnb_videos
+from sparse_coding_torch.load_data import load_yolo_clips, load_pnb_videos
-from keras_model import SparseCode, Classifier, ReconSparse
+from sparse_coding_torch.keras_model import SparseCode, Classifier, ReconSparse
 import time
 import numpy as np
 from sklearn.metrics import f1_score, accuracy_score, confusion_matrix
@@ -64,9 +64,14 @@ if __name__ == "__main__":
    if args.sparse_checkpoint:
        recon_model = keras.models.load_model(args.sparse_checkpoint)
-    splits, dataset = load_pnb_videos(args.batch_size, mode='k_fold', device=None, n_splits=args.n_splits, sparse_model=None)
+    splits, dataset = load_pnb_videos(args.batch_size, classify_mode=True, mode='k_fold', device=None, n_splits=args.n_splits, sparse_model=None)
    i_fold = 0
+    overall_true = []
+    overall_pred = []
+    fn_ids = []
+    fp_ids = []
    for train_idx, test_idx in splits:
        train_sampler = torch.utils.data.SubsetRandomSampler(train_idx)
@@ -87,11 +92,6 @@ if __name__ == "__main__":
        classifier_model = keras.Model(inputs=classifier_inputs, outputs=classifier_outputs)
-        overall_true = []
-        overall_pred = []
-        fn_ids = []
-        fp_ids = []
        best_so_far = float('inf')
        criterion = keras.losses.BinaryCrossentropy(from_logits=False)
@@ -224,15 +224,17 @@ if __name__ == "__main__":
                epoch_loss += loss * local_batch.size(0)
                for i, v_f in enumerate(vid_f):
-                    if v_f not in pred_dict:
+                    final_pred = tf.math.round(pred[i])[0]
-                        pred_dict[v_f] = tf.math.round(tf.math.sigmoid(pred[i]))
+                    gt = torch_labels[i]
-                    else:
-                        pred_dict[v_f] = tf.concat((pred_dict[v_f], tf.math.round(tf.math.sigmoid(pred[i]))), axis=0)
+                    overall_true.append(gt)
+                    overall_pred.append(final_pred)
-                    if v_f not in gt_dict:
+                    if final_pred != gt:
-                        gt_dict[v_f] = tf.constant(torch_labels[i])
+                        if final_pred == 0:
+                            fn_ids.append(v_f)
                        else:
-                        gt_dict[v_f] = tf.concat((gt_dict[v_f], torch_labels[i]), axis=0)
+                            fp_ids.append(v_f)
                if y_true is None:
                    y_true = torch_labels
@@ -243,55 +245,6 @@ if __name__ == "__main__":
            t2 = time.perf_counter()
-            vid_acc = []
-            for k in pred_dict.keys():
-                print(k)
-                print(pred_dict[k])
-                print(gt_dict[k])
-                gt_mode = torch.mode(torch.tensor(gt_dict[k]))[0].item()
-                perm = torch.randperm(torch.tensor(pred_dict[k]).size(0))
-                cutoff = int(torch.tensor(pred_dict[k]).size(0)/4)
-                if cutoff < 3:
-                    cutoff = 3
-                idx = perm[:cutoff]
-                samples = pred_dict[k][idx]
-                pred_mode = torch.mode(torch.tensor(samples))[0].item()
-                overall_true.append(gt_mode)
-                overall_pred.append(pred_mode)
-                if pred_mode == gt_mode:
-                    vid_acc.append(1)
-                else:
-                    vid_acc.append(0)
-                    if pred_mode == 0:
-                        fn_ids.append(k)
-                    else:
-                        fp_ids.append(k)
-            vid_acc = np.array(vid_acc)
-            print('----------------------------------------------------------------------------')
-            for k in pred_dict.keys():
-                print(k)
-                print('Predictions:')
-                print(pred_dict[k])
-                print('Ground Truth:')
-                print(gt_dict[k])
-                print('Overall Prediction:')
-    #                 pred_mode = 1
-    #                 contiguous_zeros = 0
-    #                 best_num = 0
-    #                 for val in pred_dict[k]:
-    #                     if val.item() == 0:
-    #                         contiguous_zeros += 1
-    #                     else:
-    #                         if contiguous_zeros > best_num:
-    #                             best_num = contiguous_zeros
-    #                             contiguous_zeros = 0
-    #                 if best_num >= 4 or contiguous_zeros >= 4:
-    #                     pred_mode = 0
-                print(torch.mode(pred_dict[k])[0].item())
-                print('----------------------------------------------------------------------------')
            print('fold={}, loss={:.2f}, time={:.2f}'.format(i_fold, loss, t2-t1))
            y_true = tf.cast(y_true, tf.int32)
@@ -299,9 +252,8 @@ if __name__ == "__main__":
            f1 = f1_score(y_true, y_pred, average='macro')
            accuracy = accuracy_score(y_true, y_pred)
-            all_errors.append(np.sum(vid_acc) / len(vid_acc))
-            print("Test f1={:.2f}, clip_acc={:.2f}, vid_acc={:.2f} fold={}".format(f1, accuracy, np.sum(vid_acc) / len(vid_acc), i_fold))
+            print("Test f1={:.2f}, clip_acc={:.2f}, fold={}".format(f1, accuracy, i_fold))
            print(confusion_matrix(y_true, y_pred))

--- a/keras/train_sparse_model.py
+++ b/keras/train_sparse_model.py
@@ -7,10 +7,10 @@ from matplotlib.animation import FuncAnimation
 from tqdm import tqdm
 import argparse
 import os
-from load_data import load_yolo_clips, load_pnb_videos
+from sparse_coding_torch.load_data import load_yolo_clips, load_pnb_videos
 import tensorflow.keras as keras
 import tensorflow as tf
-from keras_model import normalize_weights_3d, normalize_weights, SparseCode, load_pytorch_weights, ReconSparse
+from sparse_coding_torch.keras_model import normalize_weights_3d, normalize_weights, SparseCode, load_pytorch_weights, ReconSparse
 import random
 def plot_video(video):
@@ -134,7 +134,7 @@ if __name__ == "__main__":
        out_f.write(str(args))
    if args.dataset == 'pnb':
-        train_loader, _ = load_pnb_videos(args.batch_size, mode='all_train', device=device, n_splits=1, sparse_model=None)
+        train_loader, _ = load_pnb_videos(args.batch_size, classify_mode=False, mode='all_train', device=device, n_splits=1, sparse_model=None)
    elif args.dataset == 'ptx':
        train_loader, _ = load_yolo_clips(args.batch_size, num_clips=1, num_positives=15, mode='all_train', device=device, n_splits=1, sparse_model=None, whole_video=False, positive_videos='../positive_videos.json')
    else:

--- a/keras/video_loader.py
+++ b/keras/video_loader.py
@@ -61,19 +61,15 @@ class VideoGrayScaler(nn.Module):
 class PNBLoader(Dataset):
-    def __init__(self, video_path, num_frames=5, frame_rate=20, frames_between_clips=None, transform=None):
+    def __init__(self, video_path, classify_mode=False, num_frames=5, frame_rate=20, frames_between_clips=None, transform=None, augmentation=None):
        self.transform = transform
+        self.augmentation = augmentation
        self.labels = [name for name in listdir(video_path) if isdir(join(video_path, name))]
        self.videos = []
        for label in self.labels:
            self.videos.extend([(label, abspath(join(video_path, label, f)), f) for f in glob.glob(join(video_path, label, '*', '*.mp4'))])
-        #for v in self.videos:
-        #    video, _, info = read_video(v[1])
-        #    print(video.shape)
-        #    print(info)
        if not frames_between_clips:
            frames_between_clips = num_frames
@@ -82,13 +78,19 @@ class PNBLoader(Dataset):
        self.video_idx = []
        vid_idx = 0
-        for _, path, _ in self.videos:
+        for _, path, _ in tqdm(self.videos):
            vc = tv.io.read_video(path)[0].permute(3, 0, 1, 2)
-#             for j in range(vc.size(1), vc.size(1) - 10, -5):
+            if classify_mode:
+                if vc.size(1) < 5:
+                    continue
+                vc_sub = vc[:, -5:, :, :]
+                if self.transform:
+                    vc_sub = self.transform(vc_sub)
+                self.clips.append((self.videos[vid_idx][0], vc_sub, self.videos[vid_idx][2]))
+                self.video_idx.append(vid_idx)
+            else:
                for j in range(0, vc.size(1) - 5, 5):
-#                 if j-5 < 0:
-#                     continue
-#                 vc_sub = vc_1 = vc[:, j-5:j, :, :]
                    vc_sub = vc[:, j:j+5, :, :]
                    if self.transform:
                        vc_sub = self.transform(vc_sub)
@@ -107,7 +109,12 @@ class PNBLoader(Dataset):
        return [self.clips[i][0] for i in range(len(self.clips))]
    def __getitem__(self, index):
-        return self.clips[index]
+        label, clip, vid_f = self.clips[index]
+        if self.augmentation:
+            clip = clip.swapaxes(0, 1)
+            clip = self.augmentation(clip)
+            clip = clip.swapaxes(0, 1)
+        return (label, clip, vid_f)
    def __len__(self):
        return len(self.clips)